Hermes Agent 架构概述
Hermes Agent 是由硅谷 AI 研究机构 Nous Research 于 2026 年 2 月正式发布的开源自主 AI 智能体框架,遵循 MIT 开源协议。与传统的聊天机器人或代码辅助工具不同,Hermes Agent 的核心定位是一个“会随着使用不断成长的自进化 Agent”,其官方口号是“the agent that grows with you”。
Hermes Agent 架构概述
一、项目概述
Hermes Agent 是由硅谷 AI 研究机构 Nous Research 于 2026 年 2 月正式发布的开源自主 AI 智能体框架,遵循 MIT 开源协议。与传统的聊天机器人或代码辅助工具不同,Hermes Agent 的核心定位是一个“会随着使用不断成长的自进化 Agent”,其官方口号是“the agent that grows with you”。
自发布以来,Hermes Agent 在 GitHub 上的 Star 数持续攀升,上线仅两个月便突破 4.7 万星,单日最高新增超 6400 星,连续多日霸榜全球开源榜单第一。在 OpenRouter 平台上,其 Token 使用量一度进入全球前列,成为 OpenClaw 之后最受关注的开源 Agent 框架之一。
从本质上看,Hermes Agent 解决了传统 AI 助手长期存在的痛点——会话结束后一切清零,每次对话都需要重新交代背景、重复解释偏好。Hermes Agent 通过内置的完整学习闭环,实现跨会话的持久化记忆、自动化的技能沉淀与迭代,让 Agent 真正从一个“一次性工具”转变为“长期助理”。
二、设计哲学:闭环学习优先
Hermes Agent 与同期爆火的 OpenClaw 在设计哲学上存在本质差异。OpenClaw 的核心是一套 Gateway 架构,设计重心在于连接和协调——统一管理会话、路由和渠道,将 Telegram、Slack、WhatsApp 等入口汇聚到一个调度中心。而 Hermes 走的是另一条路线,整个系统的核心不是网关,而是 Agent 自身的执行循环,官方称之为 closed learning loop(闭环学习循环) 。
两者可以概括为:OpenClaw 负责“干活”,Hermes 负责“动脑”。OpenClaw 的能力由人类预设,技能需要手动编写和安装,行为稳定可控,适合处理步骤明确的批量任务。Hermes 则强调 Agent 自己从任务中“长出”能力,技能自动生成、自动迭代,记忆跨平台互通,越用越懂用户。
这种设计哲学的差异决定了 Hermes 的架构方向:把复杂度更多地收敛进模型和学习循环本身,而不是不断堆叠外部编排层。当 Agent 被设计为长期运行的系统时,这种路径选择可能更具可持续性。
三、分层架构详解
Hermes Agent 采用自研同步执行引擎,核心围绕“执行-学习-进化”闭环设计。与 OpenClaw 的 Hub-and-Spoke 中心网关架构不同,Hermes 回归了单 Agent 架构——它是一个运行在持久循环中的单 Agent 系统,没有复杂的编排层。
3.1 总体架构模型
Hermes Agent 的整体架构可以理解为三层进化飞轮与四层记忆系统的有机融合:
- 执行层:接收用户指令,调用模型推理,执行工具操作
- 学习层:记录任务轨迹,提炼可复用经验,生成结构化 Skill
- 记忆层:存储用户偏好、项目信息、会话历史,支持跨会话召回
这种分层设计使得 Hermes 能够在单进程内完成从感知、决策、行动到反思、记忆的完整生命周期管理,架构清晰且复杂度可控。
3.2 四层记忆架构
Hermes 的记忆系统并非单一的存储方案,而是四个层次分明的子系统,每个层次承担不同的记忆职能:
第一层:Prompt Memory(热记忆)
存储于 ~/.hermes/memories/ 目录下的两个文件中:
MEMORY.md(约 2,200 字符):存储环境细节、项目约定、发现的问题解决方法、经验教训等持久化事实USER.md(约 1,375 字符):存储用户偏好、沟通风格、身份信息等用户画像
这两份文件在会话启动时作为冻结快照加载到系统提示词中,以保证 LLM 前缀缓存的稳定性。会话期间的更新会立即持久化到磁盘,但不会在当前会话的提示词中生效,而是在下一次会话时加载。
第二层:Session Archive(冷召回)
所有 CLI 和消息平台的会话记录都被存储在 SQLite 数据库中(~/.hermes/state.db)。Agent 可以通过 session_search 工具进行情景回忆,搜索“之前是否讨论过某个问题”或“上周某个服务发生了什么”。检索结果会由可配置的 LLM 调用进行摘要处理。
第三层:Skills(程序性记忆)
当 Hermes 完成一个复杂任务后,它会自动编写一个可复用的技能文档——一个 Markdown 文件,记录解决问题的思路、使用的工具、具体步骤以及踩过的坑。这些技能存储在 ~/.hermes/skills/ 目录中,可被搜索,且随着 Agent 的复用和优化而不断自我改进。这正是 Hermes 自进化能力的核心载体。
第四层:External Provider(外部记忆,可选)
Hermes 提供了可插拔的外部记忆提供商系统,在原生记忆层之上增加结构化提取、实体解析和跨会话持久化能力。
3.3 渐进式懒加载:Token 效率的关键
Hermes Agent 采用三级渐进式懒加载设计。平时只加载技能的名称和简短描述(Level 0),只有当任务需要执行对应技能时,才会加载该技能的完整内容(Level 1)。据实测,同样的任务,Hermes Agent 的 Token 消耗大约只有同类框架的二十分之一。
技能生成的触发条件也经过精心设计:当一轮任务的工具调用超过 5 次、任务中途出过错后自行修复、用户曾做出纠正、或者走了某条不明显但有效的路径——满足任何一条,Hermes 就会在 ~/.hermes/skills/ 目录中生成一个 Skill 文件。这种设计确保了只有真正值得沉淀的经验才会被记录下来,避免了过度生成带来的噪声和 Token 浪费。
四、核心机制:Agent Loop 的三驾马车
Hermes Agent 的自我进化能力由 Agent Loop 的三项核心机制支撑,其中 Skill 自动生成机制最为关键。
4.1 Skill 自动生成与更新
复杂任务完成后,Hermes 会自动回顾对话过程,判断是否有值得复用的执行经验。如果有,就保存为 Skill;如果已有相关 Skill,则更新现有内容。生成的 Skill 文件遵循 agentskills.io 开放标准,包含名称、版本、触发条件、所需工具、执行步骤和注意事项等结构化信息。
一个典型 Skill 的 Frontmatter 示例如下:
---
name: github-trending-analysis
version: 2
trigger: "分析 GitHub trending"
tools_required: [web_search, web_fetch, file_write]
---
# GitHub Trending 分析
## 步骤
1. 使用 web_search 搜索 GitHub trending 页面
2. 使用 web_fetch 获取详细内容
3. 提取项目名称、star 数、描述
4. 按 star 增速排序
5. 生成结构化报告并写入文件
4.2 用户偏好注入
新会话开始时,Hermes 会自动将用户信息注入上下文,使其具备对用户长期偏好和环境信息的认知。这些信息来源于对话过程中 Hermes 主动写入的 MEMORY.md 和 USER.md 两个本地文件。
值得注意的是,Hermes 采用了 frozen snapshot 策略:即使记忆内容在会话过程中发生更新,当前会话的 prompt 设置也不会随之改变,从而避免重复计算提示词,显著降低运行成本。
4.3 历史会话检索
Hermes 会自动记录历史会话的完整消息,并按需检索。每轮对话消息被写入 SQLite 数据库,并通过 FTS5 工具建立全文索引。当需要回溯历史会话内容时,Agent 会在 Agent Loop 的工具调用环节发起 session_search,在原始对话记录中搜索相关片段,再继续作答。
五、部署架构与生态
5.1 灵活的部署方式
Hermes Agent 的设计充分考虑了工程灵活性,能够适配多种部署模式:本地开发机、远程服务器、容器化执行环境、云端弹性运行环境等。具体部署路径包括:
Docker Compose 轻量编排:适用于开发测试与中小规模生产场景
Kubernetes 原生部署:面向高可用、弹性伸缩的生产环境
SSH 异构集群:适用于混合操作系统环境
Modal 无服务器接入:适用于突发性高负载任务调度
据官方文档,Hermes Agent 可以在仅需 5 美元的 VPS 上顺畅运行,门槛远低于许多同类框架。
5.2 多平台网关
Hermes Agent 原生支持 Telegram、Discord、Slack、WhatsApp 等主流消息平台,并在国内生态中扩展了对微信、QQ、飞书等渠道的支持。这一能力使得 Hermes 可以作为统一的智能体服务入口,在不同渠道之间共享同一套记忆和技能系统。
5.3 模型兼容性与工具扩展
Hermes Agent 支持超过 200 种大模型的一键切换,兼容 OpenAI、Anthropic、Ollama 等主流 API,以及国内的阿里云百炼、通义千问等平台。框架内置了 40+ 工具,涵盖 Shell 命令执行、文件系统操作、Web 搜索、浏览器自动化等核心能力。此外,Hermes 通过 MCP(Model Context Protocol)实现了工具系统的灵活扩展,可接入数千个第三方 SaaS 应用。
六、总结
Hermes Agent 的架构设计体现了对 Agent 长期运行场景的深刻思考。与追求连接广度的 OpenClaw 不同,Hermes 选择了一条更强调学习深度的路径——通过四层记忆架构、渐进式懒加载和闭环学习循环,构建了一个“越用越聪明”的自进化 Agent 系统。
从技术选型上看,Hermes 的开源 MIT 协议、灵活的部署架构和丰富的模型兼容性,使其成为个人开发者、技术团队乃至企业级应用的有力选择。随着社区生态的持续完善,Hermes Agent 有望在 Agent 框架的发展演进中占据重要一席。
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐



所有评论(0)