Hermes Agent 架构概述

Hermes Agent 是由硅谷 AI 研究机构 Nous Research 于 2026 年 2 月正式发布的开源自主 AI 智能体框架，遵循 MIT 开源协议。与传统的聊天机器人或代码辅助工具不同，Hermes Agent 的核心定位是一个“会随着使用不断成长的自进化 Agent”，其官方口号是“the agent that grows with you”。

hello_250

525人浏览 · 2026-04-19 01:37:32

hello_250 · 2026-04-19 01:37:32 发布

Hermes Agent 架构概述

一、项目概述

自发布以来，Hermes Agent 在 GitHub 上的 Star 数持续攀升，上线仅两个月便突破 4.7 万星，单日最高新增超 6400 星，连续多日霸榜全球开源榜单第一。在 OpenRouter 平台上，其 Token 使用量一度进入全球前列，成为 OpenClaw 之后最受关注的开源 Agent 框架之一。

从本质上看，Hermes Agent 解决了传统 AI 助手长期存在的痛点——会话结束后一切清零，每次对话都需要重新交代背景、重复解释偏好。Hermes Agent 通过内置的完整学习闭环，实现跨会话的持久化记忆、自动化的技能沉淀与迭代，让 Agent 真正从一个“一次性工具”转变为“长期助理”。

二、设计哲学：闭环学习优先

Hermes Agent 与同期爆火的 OpenClaw 在设计哲学上存在本质差异。OpenClaw 的核心是一套 Gateway 架构，设计重心在于连接和协调——统一管理会话、路由和渠道，将 Telegram、Slack、WhatsApp 等入口汇聚到一个调度中心。而 Hermes 走的是另一条路线，整个系统的核心不是网关，而是 Agent 自身的执行循环，官方称之为 closed learning loop（闭环学习循环） 。

两者可以概括为：OpenClaw 负责“干活”，Hermes 负责“动脑”。OpenClaw 的能力由人类预设，技能需要手动编写和安装，行为稳定可控，适合处理步骤明确的批量任务。Hermes 则强调 Agent 自己从任务中“长出”能力，技能自动生成、自动迭代，记忆跨平台互通，越用越懂用户。

这种设计哲学的差异决定了 Hermes 的架构方向：把复杂度更多地收敛进模型和学习循环本身，而不是不断堆叠外部编排层。当 Agent 被设计为长期运行的系统时，这种路径选择可能更具可持续性。

三、分层架构详解

Hermes Agent 采用自研同步执行引擎，核心围绕“执行-学习-进化”闭环设计。与 OpenClaw 的 Hub-and-Spoke 中心网关架构不同，Hermes 回归了单 Agent 架构——它是一个运行在持久循环中的单 Agent 系统，没有复杂的编排层。

3.1 总体架构模型

Hermes Agent 的整体架构可以理解为三层进化飞轮与四层记忆系统的有机融合：

执行层：接收用户指令，调用模型推理，执行工具操作
学习层：记录任务轨迹，提炼可复用经验，生成结构化 Skill
记忆层：存储用户偏好、项目信息、会话历史，支持跨会话召回

这种分层设计使得 Hermes 能够在单进程内完成从感知、决策、行动到反思、记忆的完整生命周期管理，架构清晰且复杂度可控。

3.2 四层记忆架构

Hermes 的记忆系统并非单一的存储方案，而是四个层次分明的子系统，每个层次承担不同的记忆职能：

第一层：Prompt Memory（热记忆）
存储于 ~/.hermes/memories/ 目录下的两个文件中：

MEMORY.md（约 2,200 字符）：存储环境细节、项目约定、发现的问题解决方法、经验教训等持久化事实
USER.md（约 1,375 字符）：存储用户偏好、沟通风格、身份信息等用户画像

这两份文件在会话启动时作为冻结快照加载到系统提示词中，以保证 LLM 前缀缓存的稳定性。会话期间的更新会立即持久化到磁盘，但不会在当前会话的提示词中生效，而是在下一次会话时加载。

第二层：Session Archive（冷召回）
所有 CLI 和消息平台的会话记录都被存储在 SQLite 数据库中（~/.hermes/state.db）。Agent 可以通过 session_search 工具进行情景回忆，搜索“之前是否讨论过某个问题”或“上周某个服务发生了什么”。检索结果会由可配置的 LLM 调用进行摘要处理。

第三层：Skills（程序性记忆）
当 Hermes 完成一个复杂任务后，它会自动编写一个可复用的技能文档——一个 Markdown 文件，记录解决问题的思路、使用的工具、具体步骤以及踩过的坑。这些技能存储在 ~/.hermes/skills/ 目录中，可被搜索，且随着 Agent 的复用和优化而不断自我改进。这正是 Hermes 自进化能力的核心载体。

第四层：External Provider（外部记忆，可选）
Hermes 提供了可插拔的外部记忆提供商系统，在原生记忆层之上增加结构化提取、实体解析和跨会话持久化能力。

3.3 渐进式懒加载：Token 效率的关键

Hermes Agent 采用三级渐进式懒加载设计。平时只加载技能的名称和简短描述（Level 0），只有当任务需要执行对应技能时，才会加载该技能的完整内容（Level 1）。据实测，同样的任务，Hermes Agent 的 Token 消耗大约只有同类框架的二十分之一。

技能生成的触发条件也经过精心设计：当一轮任务的工具调用超过 5 次、任务中途出过错后自行修复、用户曾做出纠正、或者走了某条不明显但有效的路径——满足任何一条，Hermes 就会在 ~/.hermes/skills/ 目录中生成一个 Skill 文件。这种设计确保了只有真正值得沉淀的经验才会被记录下来，避免了过度生成带来的噪声和 Token 浪费。

四、核心机制：Agent Loop 的三驾马车

Hermes Agent 的自我进化能力由 Agent Loop 的三项核心机制支撑，其中 Skill 自动生成机制最为关键。

4.1 Skill 自动生成与更新

复杂任务完成后，Hermes 会自动回顾对话过程，判断是否有值得复用的执行经验。如果有，就保存为 Skill；如果已有相关 Skill，则更新现有内容。生成的 Skill 文件遵循 agentskills.io 开放标准，包含名称、版本、触发条件、所需工具、执行步骤和注意事项等结构化信息。

一个典型 Skill 的 Frontmatter 示例如下：

---
name: github-trending-analysis
version: 2
trigger: "分析 GitHub trending"
tools_required: [web_search, web_fetch, file_write]
---
# GitHub Trending 分析
## 步骤
1. 使用 web_search 搜索 GitHub trending 页面
2. 使用 web_fetch 获取详细内容
3. 提取项目名称、star 数、描述
4. 按 star 增速排序
5. 生成结构化报告并写入文件

4.2 用户偏好注入

新会话开始时，Hermes 会自动将用户信息注入上下文，使其具备对用户长期偏好和环境信息的认知。这些信息来源于对话过程中 Hermes 主动写入的 MEMORY.md 和 USER.md 两个本地文件。

值得注意的是，Hermes 采用了 frozen snapshot 策略：即使记忆内容在会话过程中发生更新，当前会话的 prompt 设置也不会随之改变，从而避免重复计算提示词，显著降低运行成本。

4.3 历史会话检索

Hermes 会自动记录历史会话的完整消息，并按需检索。每轮对话消息被写入 SQLite 数据库，并通过 FTS5 工具建立全文索引。当需要回溯历史会话内容时，Agent 会在 Agent Loop 的工具调用环节发起 session_search，在原始对话记录中搜索相关片段，再继续作答。

五、部署架构与生态

5.1 灵活的部署方式

Hermes Agent 的设计充分考虑了工程灵活性，能够适配多种部署模式：本地开发机、远程服务器、容器化执行环境、云端弹性运行环境等。具体部署路径包括：

Docker Compose 轻量编排：适用于开发测试与中小规模生产场景

Kubernetes 原生部署：面向高可用、弹性伸缩的生产环境

SSH 异构集群：适用于混合操作系统环境

Modal 无服务器接入：适用于突发性高负载任务调度

据官方文档，Hermes Agent 可以在仅需 5 美元的 VPS 上顺畅运行，门槛远低于许多同类框架。

5.2 多平台网关

Hermes Agent 原生支持 Telegram、Discord、Slack、WhatsApp 等主流消息平台，并在国内生态中扩展了对微信、QQ、飞书等渠道的支持。这一能力使得 Hermes 可以作为统一的智能体服务入口，在不同渠道之间共享同一套记忆和技能系统。

5.3 模型兼容性与工具扩展

Hermes Agent 支持超过 200 种大模型的一键切换，兼容 OpenAI、Anthropic、Ollama 等主流 API，以及国内的阿里云百炼、通义千问等平台。框架内置了 40+ 工具，涵盖 Shell 命令执行、文件系统操作、Web 搜索、浏览器自动化等核心能力。此外，Hermes 通过 MCP（Model Context Protocol）实现了工具系统的灵活扩展，可接入数千个第三方 SaaS 应用。

六、总结
Hermes Agent 的架构设计体现了对 Agent 长期运行场景的深刻思考。与追求连接广度的 OpenClaw 不同，Hermes 选择了一条更强调学习深度的路径——通过四层记忆架构、渐进式懒加载和闭环学习循环，构建了一个“越用越聪明”的自进化 Agent 系统。

从技术选型上看，Hermes 的开源 MIT 协议、灵活的部署架构和丰富的模型兼容性，使其成为个人开发者、技术团队乃至企业级应用的有力选择。随着社区生态的持续完善，Hermes Agent 有望在 Agent 框架的发展演进中占据重要一席。