EM-Core-Agent:AI Agent 具身认知核心系统——架构白皮书 V1.0
EM-Core-Agent是一套基于EM-Core具身认知核心与MLNF-Mem记忆系统的AI Agent认知架构。其核心创新在于:1)采用"认知-记忆-执行"三模块解耦设计,2)构建双漏斗记忆体系实现用户隐私与任务经验的物理隔离,3)默认本地离线运行保障数据安全。系统严格遵循人类认知分工,通过五层晋升机制实现经验进化,解决现有Agent在长期记忆、行为一致性和隐私保护方面的痛点。架构与机器人、自
EM-Core-Agent:AI Agent 具身认知核心系统——架构白皮书 V1.0
版本:V1.0 | 发布日期:2026年6月
核心架构原创提出者:文波福
适用领域:AI Agent、智能助手、自动化工作流、企业数字员工
底层架构:EM-Core 通用智能架构 + MLNF-Mem 多级嵌套漏斗记忆与经验中枢
同源适配:与 EM-Core-HR(人形机器人)、EM-Core-AD(自动驾驶)底层逻辑同源,仅做AI Agent场景专项适配
开源许可:CC BY-NC 4.0(署名-非商业性使用 4.0 国际许可证)
摘要
本白皮书正式提出一套以 EM-Core 具身认知核心与 MLNF-Mem 记忆经验中枢为底层理论的 AI Agent 认知系统。系统严格遵循人类认知分工,将记忆存贮、实时推理与工具执行解耦为三大独立模块,并引入双漏斗记忆体系,系统性解决了当前 AI Agent 面临的长期记忆混乱、行为缺乏一致性、用户隐私与经验泛化矛盾三大核心痛点。
与主流依赖云端大模型的 Agent 方案不同,EM-Core-Agent 默认以本地离线运行为核心范式。整套认知大脑、记忆中枢、执行层可完整部署在个人终端(PC、手机、边缘设备),全程离线闭环、数据本机留存,最大化保障用户隐私与数据安全。云端模式仅作为企业可选增值能力。
白皮书完整阐述系统架构、模块职责、数据流、安全红线与工程落地规范。架构底层与 EM-Core-HR 人形机器人认知系统、EM-Core-AD 自动驾驶认知系统思想同源、逻辑同源、架构同源,大幅降低跨领域智能系统研发成本。
一、系统总览与核心定位
1.1 核心定位
EM-Core-Agent 定位为 AI Agent 的原生 “大脑与记忆系统”,以 EM-Core 具身认知体系为顶层骨架,以 MLNF-Mem 记忆经验中枢为长期记忆内核,构建“认知-记忆-执行”全链路闭环。系统默认以本地离线运行,数据完全留存于用户设备,无需依赖云端基础设施。
与当前主流 AI Agent 方案的本质区别:
| 对比维度 | 当前主流 Agent | EM-Core-Agent |
|---|---|---|
| 长期记忆 | 依赖大模型上下文窗口,容量有限 | 独立记忆中枢,轻量化终身记忆 |
| 用户画像 | 无隔离,混入提示词 | 双漏斗物理隔离,隐私本地加密 |
| 经验进化 | 无结构化经验沉淀 | 五层晋升+三维重要度,从单次经验到通用技能 |
| 安全可控 | 依赖提示词约束,易被绕过 | 安全仲裁模块,工具调用白名单+敏感操作确认 |
| 大模型依赖 | 强依赖,无大模型不可用 | 松耦合,核心功能离线完整,大模型仅作可选工具 |
| 部署模式 | 强制云端 | 本地优先,云端仅企业可选 |
1.2 核心模块构成
| 模块 | 全称 | 定位 | 一句话职责 |
|---|---|---|---|
| 双漏斗记忆系统 | Agent-mlnf-mem | 经验仓库 | 一漏斗懂人(用户画像),一漏斗练己(任务经验),物理隔离互不干扰 |
| 认知大脑 | Agent-ecc-brain | 实时思考 | 意图解析、任务规划、工具选择、安全仲裁、全部决策输出 |
| 行动执行层 | Agent-mcc-exec | 工具调用 | 工具注册、API调用、代码执行、结果校验的精准执行 |
1.3 系统架构拓扑
┌──────────────────────────────────────────────────────────────────┐
│ EM-Core-Agent │
│ │
│ ┌──────────────────────┐ ┌──────────────────────────┐ │
│ │ Agent-mlnf-mem │ │ Agent-ecc-brain │ │
│ │ 记忆中枢 │←──────→│ 认知大脑 │ │
│ │ │ │ │ │
│ │ ┌──────────────────┐ │ │ ┌──────────────────────┐ │ │
│ │ │ 漏斗一:用户画像 │ │ │ │ 意图解析→任务规划 │ │ │
│ │ │ 偏好/习惯/反馈 │ │ │ │ →工具选择→安全仲裁 │ │ │
│ │ │ L1→L2→L3→L4→L5 │ │ │ └──────────────────────┘ │ │
│ │ └──────────────────┘ │ │ │ │
│ │ ┌──────────────────┐ │ │ │ │
│ │ │ 漏斗二:任务经验 │ │ │ │ │
│ │ │ 执行策略/成败案例 │ │ │ │ │
│ │ │ L1→L2→L3→L4→L5 │ │ │ │ │
│ │ └──────────────────┘ │ │ │ │
│ └──────────────────────┘ └────────────┬───────────────┘ │
│ │ │
│ │ 工具调用指令 │
│ ▼ │
│ ┌──────────────────────────┐ │
│ │ Agent-mcc-exec │ │
│ │ 行动执行层 │ │
│ │ │ │
│ │ 工具注册 │ API调用 │ │
│ │ 代码执行 │ 结果校验 │ │
│ └──────────────────────────┘ │
└──────────────────────────────────────────────────────────────────┘
1.4 核心数据流
- 用户输入 → 认知大脑意图解析(本地)
- 认知大脑向记忆中枢查询用户偏好与历史经验(本地)
- 认知大脑完成任务规划与工具选择(本地)
- 安全仲裁模块审查方案,通过后下发工具调用指令(本地)
- 行动执行层执行工具调用,返回结构化结果
- 执行结果回采,经验片段写入记忆中枢
- 记忆中枢依据三维重要度公式自动筛选、晋升或遗忘
二、功能边界与能力范围
2.1 基础版功能清单(CC BY-NC 4.0 开源)
| 功能 | 说明 | 离线可用 |
|---|---|---|
| 对话交互 | 自然语言输入,自然语言输出,多轮对话记忆 | ✅ |
| 意图理解 | 解析用户意图,识别任务类型和实体 | ✅ |
| 任务规划 | 复杂任务自动拆解为可执行步骤序列 | ✅ |
| 工具调用 | 内置基础工具(文件读写、本地搜索、计算器、系统信息等) | ✅(部分工具需网络) |
| 长期记忆 | 记住用户偏好、历史对话、执行经验 | ✅ |
| 用户画像 | 自动沉淀用户习惯与偏好,无需手动配置 | ✅ |
| 经验进化 | 从成功/失败任务中学习,优化后续策略 | ✅ |
| 安全仲裁 | 敏感操作自动拦截并请求确认 | ✅ |
| 本地数据存储 | 所有记忆和画像数据仅存本机,默认不上传 | ✅ |
2.2 内置基础工具
| 工具 | 说明 | 离线可用 |
|---|---|---|
| 文件读写 | 读取、创建、编辑本地文件 | ✅ |
| 本地搜索 | 在用户指定目录中搜索文件内容 | ✅ |
| 计算器 | 数学表达式求值 | ✅ |
| 系统信息 | 查看设备状态(内存、存储、网络) | ✅ |
| 天气查询 | 通过 API 获取天气信息 | ❌(需联网) |
| 网页搜索 | 通过搜索引擎 API 获取信息 | ❌(需联网) |
| 大模型调用 | 调用 LLM API 处理复杂语言任务 | ❌(需联网,可选) |
2.3 能力边界
| 能力维度 | 能做到的 | 做不到的 |
|---|---|---|
| 任务复杂度 | 多步骤任务(如“帮我整理上周的文档并按日期分类”) | 需要实时多源数据融合的超复杂任务 |
| 记忆深度 | 记住用户偏好、历史对话、常用工具 | 像人类一样理解情感和潜台词 |
| 自主学习 | 从任务成功/失败中优化策略 | 无监督的领域知识发现 |
| 工具使用 | 调用已注册的工具,组合使用 | 自动发现和注册新的外部工具 |
| 推理能力 | 基于规则的意图解析和任务规划 | 需要大模型才能完成的深度语义理解 |
| 离线能力 | 所有核心功能离线运行 | 需要网络数据的任务(搜索、大模型调用) |
2.4 与大模型的关系
| 场景 | 处理方式 |
|---|---|
| 简单意图解析 | 本地 ECC 模块完成,不调用大模型 |
| 结构化任务规划 | 本地 ECC 模块完成 |
| 记忆查询与存储 | 本地 MLNF-Mem 模块完成 |
| 复杂文本生成 | 可选调用 LLM API(用户可配置,默认不启用) |
| 深度语义理解 | 可选调用 LLM API |
| 多语言翻译 | 可选调用 LLM API |
核心原则:大模型是一个可选的工具,不是 Agent 的大脑。 Agent 的大脑是 ECC 模块。大模型只在用户需要且网络可用时才被调用。
2.5 明确不属于基础版的功能
| 功能 | 原因 |
|---|---|
| 多设备数据同步 | 需要云端基础设施,属于企业版 |
| 多用户管理 | 需要权限系统,属于企业版 |
| 审计日志持久化 | 企业合规需求,属于企业版 |
| 高可用集群部署 | 企业运维需求,属于企业版 |
三、与 OpenClaw 的差异化定位
| 能力 | OpenClaw | EM-Core-Agent |
|---|---|---|
| 工具调用 | ✅ | ✅ |
| 离线运行 | ✅ | ✅ |
| 本地数据存储 | ✅ | ✅ |
| 长期记忆体系 | ❌(依赖大模型上下文) | ✅(独立双漏斗记忆) |
| 用户画像沉淀 | ❌ | ✅(漏斗一专用) |
| 经验自我进化 | ❌ | ✅(五层晋升+三维重要度) |
| 认知决策模块 | ❌(依赖大模型推理) | ✅(ECC 独立推理) |
| 安全仲裁机制 | ❌ | ✅ |
| 端侧零依赖运行 | ❌(无大模型时能力骤降) | ✅(核心功能离线完整) |
EM-Core-Agent 与 OpenClaw 共享“本地离线优先、个人免费部署”的爆火基因,同时叠加了一套完整的认知大脑 + 双漏斗记忆 + 安全仲裁体系,这是当前开源 Agent 生态中独一无二的能力组合。
四、双漏斗记忆系统(Agent-mlnf-mem)
4.1 双漏斗物理隔离
| 漏斗 | 定位 | 运行时机 | 存储内容 |
|---|---|---|---|
| 漏斗一:用户画像漏斗 | 懂人——记录个体偏好与习惯 | 每次交互时 | 用户偏好、对话历史、反馈记录、使用习惯 |
| 漏斗二:任务经验漏斗 | 练己——沉淀任务执行策略 | 每次工具调用完成时 | 执行策略、成功/失败案例、工具调用模式 |
隔离约束:
- 双漏斗之间无数据交换、无经验融合
- 漏斗一数据仅本地加密存储,不参与Agent自我进化
- 漏斗二可脱敏泛化后跨用户复用
4.2 五层单向晋升通路
L1 临时层 → L2 近期层 → L3 中期层 → L4 长期层 → L5 核心层
(本次会话) (近7日) (近30日) (泛化技能) (永久锁定)
记忆仅可单向晋升,不可回退。晋升条件:留存时长达标 + 重要度达标。
4.3 三维重要度量化公式
重要度 I = I₀ + α·S + β·V + γ·C
| 驱动信号 | Agent 语境定义 |
|---|---|
| S(安全显著性) | 涉及敏感操作、权限提升、数据访问等高安全风险事件 |
| V(用户价值) | 用户显式标记的重要对话或任务 |
| C(复用频次) | 同类任务中该策略被成功调用的次数 |
4.4 轻量化约束
- 终身记忆总量上限:默认 100MB,可自定义扩展至设备存储上限
- 漏斗一容量占比:40%
- 漏斗二容量占比:60%
- 逼近上限时自动清理低重要度条目
五、认知大脑(Agent-ecc-brain)
5.1 核心模块清单
| 编号 | 模块名称 | 核心职责 |
|---|---|---|
| ECC-01 | 意图解析模块 | 将用户自然语言输入转化为结构化意图与实体 |
| ECC-02 | 任务规划模块 | 拆解复杂任务为可执行步骤序列 |
| ECC-03 | 工具选择模块 | 根据任务需求匹配最合适的工具 |
| ECC-04 | 安全仲裁模块 | 审查工具调用方案,执行安全边界检查 |
| ECC-05 | 记忆查询模块 | 向记忆中枢发起偏好与经验查询 |
| ECC-06 | 结果评估模块 | 评估工具执行结果,触发记忆写入 |
| ECC-07 | 工作记忆模块 | 缓存当前会话的推理中间数据 |
| ECC-08 | 元认知模块 | 自我能力评估、置信度计算、求助触发 |
| ECC-09 | 内生动机模块 | 主动发现用户需求、生成建议任务 |
| ECC-10 | 社会心智模块 | 情绪感知与交互风格适配 |
| ECC-11 | 抽象创造模块 | 从经验中提炼通用规则(高阶,需授权激活) |
| ECC-12 | 资源调度模块 | 唯一对外网关,统筹工具调用权限与LLM API配额 |
5.2 安全仲裁机制
| 操作类型 | 执行条件 |
|---|---|
| 读取文件 | 自动执行 |
| 写入文件 | 用户确认 |
| 网络请求 | 自动执行 |
| 代码执行 | 沙箱隔离 + 用户确认 |
| 涉及隐私数据 | 拦截并提示 |
| 修改系统配置 | 二次确认 |
六、行动执行层(Agent-mcc-exec)
6.1 核心模块清单
| 编号 | 模块名称 | 核心职责 |
|---|---|---|
| EXEC-01 | 工具注册中心 | 管理可用工具目录及其参数约束 |
| EXEC-02 | API 调用引擎 | 安全地执行外部 API 请求 |
| EXEC-03 | 代码执行沙箱 | 在隔离环境中运行代码 |
| EXEC-04 | 结果校验器 | 验证执行结果是否符合预期 |
| EXEC-05 | 执行偏差监控 | 对比目标结果与实际结果 |
| EXEC-06 | 闭环反馈单元 | 汇总执行结果,上报认知大脑 |
6.2 执行约束
- 仅执行认知大脑下发的工具调用指令
- 不参与任何任务规划或工具选择
- 所有执行结果结构化回传
- 执行超时自动中断并上报
七、部署架构
7.1 本地为核,全端自由部署(默认离线优先)
EM-Core-Agent 默认以本地离线运行为核心范式,区别于传统依赖云端大模型、强制上传数据的AI Agent架构。整套认知大脑、记忆中枢、执行层可完整部署在用户个人终端,全程离线闭环、数据本机留存、不上传公共云端,最大化保障用户隐私与数据安全。
云端模式仅作为企业扩展增值能力,非个人用户必需依赖。
┌─────────────────────────────────────────┐
│ 用户本地终端独立智能体(默认) │
│ 本地完整部署:ECC-Brain + MLNF-Mem + MCC-Exec │
│ │
│ 电脑 / 手机 本机全量运行,离线可用 │
│ 所有记忆、偏好、任务数据仅保存在本机 │
└─────────────────────────────────────────┘
7.2 可选云端扩展架构(企业商用增值模式)
企业用户可自行搭建私有云端中枢,实现多终端统一联动管理,仅作为商业版扩展能力:
┌─────────────────────────────────┐
│ 企业私有云端大脑(可选增值) │
│ (仅企业商用场景部署) │
└────────────┬────────────────────┘
│ HTTP / WebSocket API
┌───────┴───────┐
▼ ▼
┌──────────┐ ┌──────────────┐
│ 电脑终端 │ │ 手机终端 │
└──────────┘ └──────────────┘
7.3 部署方式
| 部署方式 | 适用场景 | 说明 |
|---|---|---|
| 本地单机部署(默认) | 个人用户、开发者、学习研究 | PC、手机均可本地完整部署全套认知+记忆+执行体系,全程离线运行、数据本机留存、非商用完全免费 |
| Docker Compose 部署 | 开发测试、个人快速搭建 | 一键部署本地完整环境,全功能离线可用 |
| 企业云端集群部署 | 商业团队、企业服务场景 | 商业授权专属能力,支持多终端统一管理、云端协同、高可用集群 |
7.4 手机端部署方案
| 方案 | 说明 | 优势 |
|---|---|---|
| PWA(渐进式Web应用) | 通过浏览器安装到手机主屏幕,与本地Python后端通信 | 跨平台、零审核、自动更新 |
| Termux + Python(Android) | 在Android手机上直接运行Python核心 | 真正的离线端侧运行 |
| 微信小程序 | 在小程序平台运行 | 用户零安装成本、传播极快(未来规划) |
7.5 运行环境说明
基础开源版本推荐运行环境:Python 3.10 及以上,Windows/Linux/macOS/移动端全平台兼容,支持个人终端完整离线部署使用。
系统默认不采集、不上传任何用户数据,原生具备高隐私特性。
八、与 EM-Core-HR/AD 的同源架构对照
| 三层架构 | EM-Core-HR(人形机器人) | EM-Core-AD(自动驾驶) | EM-Core-Agent(AI Agent) |
|---|---|---|---|
| 认知大脑 | HR-ecc-brain(12模块×112子单元) | AD-ecc-brain(12模块×47子单元) | Agent-ecc-brain(约12模块) |
| 记忆中枢 | HR-mlnf-mem(60模块,单漏斗) | AD-mlnf-mem(51模块,双漏斗) | Agent-mlnf-mem(双漏斗,复用AD架构) |
| 执行层 | HR-mcc-cerebellum(54模块,全身运动) | AD-mcc-cerebellum(38模块,车辆控制) | Agent-mcc-exec(工具调用) |
关键同源特性:
- 记忆中枢均采用 MLNF-Mem 五层单向晋升与三维重要度驱动核心理论
- 认知大脑均采用 ECC 12维认知模块架构
- 执行层均遵循“只负责精准执行,不参与决策”的原则
- 安全约束均内建于架构层级,不可绕过
九、开源协议与商业授权
9.1 基础版(本仓库及所有子仓库)
采用 CC BY-NC 4.0(署名-非商业性使用 4.0 国际许可证)进行全球开源授权。
- ✅ 个人学习、研究、非商业用途可自由使用、修改、分发
- ❌ 任何商业用途均被严格禁止
9.2 企业版(商业授权)
商业授权将提供:
- 合法的商业使用权利
- 企业级功能模块(多租户、审计日志、高可用)
- 官方技术支持与 SLA 保障
- 法律风险承担与合规背书
联系邮箱:710705008@qq.com
十、版本声明
| 项 | 内容 |
|---|---|
| 版本号 | V1.0 |
| 阶段定位 | 架构总纲、模块划分、接口规范标准化定稿 |
| 配套仓库 | Agent-ecc-brain / Agent-mlnf-mem / Agent-mcc-exec |
十一、学术引用
文波福. EM-Core-Agent:AI Agent 具身认知核心系统——架构白皮书 V1.0[EB/OL]. 2026.
十二、联系方式
- 原创提出者:文波福
- 邮箱:710705008@qq.com
- 首发平台:GitHub、Gitee、知乎、CSDN、稀土掘金
本文档为 EM-Core-Agent 架构白皮书 V1.0 正式版,统领 AI Agent 方向四个仓库的完整体系。
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐

所有评论(0)