EM-Core-Agent:AI Agent 具身认知核心系统——架构白皮书 V1.0

版本:V1.0 | 发布日期:2026年6月
核心架构原创提出者:文波福
适用领域:AI Agent、智能助手、自动化工作流、企业数字员工
底层架构:EM-Core 通用智能架构 + MLNF-Mem 多级嵌套漏斗记忆与经验中枢
同源适配:与 EM-Core-HR(人形机器人)、EM-Core-AD(自动驾驶)底层逻辑同源,仅做AI Agent场景专项适配
开源许可:CC BY-NC 4.0(署名-非商业性使用 4.0 国际许可证)

摘要

本白皮书正式提出一套以 EM-Core 具身认知核心与 MLNF-Mem 记忆经验中枢为底层理论的 AI Agent 认知系统。系统严格遵循人类认知分工,将记忆存贮、实时推理与工具执行解耦为三大独立模块,并引入双漏斗记忆体系,系统性解决了当前 AI Agent 面临的长期记忆混乱、行为缺乏一致性、用户隐私与经验泛化矛盾三大核心痛点。

与主流依赖云端大模型的 Agent 方案不同,EM-Core-Agent 默认以本地离线运行为核心范式。整套认知大脑、记忆中枢、执行层可完整部署在个人终端(PC、手机、边缘设备),全程离线闭环、数据本机留存,最大化保障用户隐私与数据安全。云端模式仅作为企业可选增值能力。

白皮书完整阐述系统架构、模块职责、数据流、安全红线与工程落地规范。架构底层与 EM-Core-HR 人形机器人认知系统、EM-Core-AD 自动驾驶认知系统思想同源、逻辑同源、架构同源,大幅降低跨领域智能系统研发成本。

一、系统总览与核心定位

1.1 核心定位

EM-Core-Agent 定位为 AI Agent 的原生 “大脑与记忆系统”,以 EM-Core 具身认知体系为顶层骨架,以 MLNF-Mem 记忆经验中枢为长期记忆内核,构建“认知-记忆-执行”全链路闭环。系统默认以本地离线运行,数据完全留存于用户设备,无需依赖云端基础设施。

与当前主流 AI Agent 方案的本质区别:

对比维度 当前主流 Agent EM-Core-Agent
长期记忆 依赖大模型上下文窗口,容量有限 独立记忆中枢,轻量化终身记忆
用户画像 无隔离,混入提示词 双漏斗物理隔离,隐私本地加密
经验进化 无结构化经验沉淀 五层晋升+三维重要度,从单次经验到通用技能
安全可控 依赖提示词约束,易被绕过 安全仲裁模块,工具调用白名单+敏感操作确认
大模型依赖 强依赖,无大模型不可用 松耦合,核心功能离线完整,大模型仅作可选工具
部署模式 强制云端 本地优先,云端仅企业可选

1.2 核心模块构成

模块 全称 定位 一句话职责
双漏斗记忆系统 Agent-mlnf-mem 经验仓库 一漏斗懂人(用户画像),一漏斗练己(任务经验),物理隔离互不干扰
认知大脑 Agent-ecc-brain 实时思考 意图解析、任务规划、工具选择、安全仲裁、全部决策输出
行动执行层 Agent-mcc-exec 工具调用 工具注册、API调用、代码执行、结果校验的精准执行

1.3 系统架构拓扑

┌──────────────────────────────────────────────────────────────────┐
│                        EM-Core-Agent                             │
│                                                                  │
│  ┌──────────────────────┐        ┌──────────────────────────┐    │
│  │   Agent-mlnf-mem     │        │   Agent-ecc-brain        │    │
│  │   记忆中枢            │←──────→│   认知大脑                │    │
│  │                      │        │                          │    │
│  │ ┌──────────────────┐ │        │ ┌──────────────────────┐ │    │
│  │ │ 漏斗一:用户画像    │ │        │ │ 意图解析→任务规划     │ │    │
│  │ │ 偏好/习惯/反馈     │ │        │ │ →工具选择→安全仲裁    │ │    │
│  │ │ L1→L2→L3→L4→L5   │ │        │ └──────────────────────┘ │    │
│  │ └──────────────────┘ │        │                            │    │
│  │ ┌──────────────────┐ │        │                            │    │
│  │ │ 漏斗二:任务经验    │ │        │                            │    │
│  │ │ 执行策略/成败案例  │ │        │                            │    │
│  │ │ L1→L2→L3→L4→L5   │ │        │                            │    │
│  │ └──────────────────┘ │        │                            │    │
│  └──────────────────────┘        └────────────┬───────────────┘    │
│                                               │                   │
│                                               │ 工具调用指令       │
│                                               ▼                   │
│                                   ┌──────────────────────────┐    │
│                                   │   Agent-mcc-exec         │    │
│                                   │   行动执行层              │    │
│                                   │                          │    │
│                                   │ 工具注册 │ API调用        │    │
│                                   │ 代码执行 │ 结果校验       │    │
│                                   └──────────────────────────┘    │
└──────────────────────────────────────────────────────────────────┘

1.4 核心数据流

  1. 用户输入 → 认知大脑意图解析(本地)
  2. 认知大脑向记忆中枢查询用户偏好与历史经验(本地)
  3. 认知大脑完成任务规划与工具选择(本地)
  4. 安全仲裁模块审查方案,通过后下发工具调用指令(本地)
  5. 行动执行层执行工具调用,返回结构化结果
  6. 执行结果回采,经验片段写入记忆中枢
  7. 记忆中枢依据三维重要度公式自动筛选、晋升或遗忘

二、功能边界与能力范围

2.1 基础版功能清单(CC BY-NC 4.0 开源)

功能 说明 离线可用
对话交互 自然语言输入,自然语言输出,多轮对话记忆
意图理解 解析用户意图,识别任务类型和实体
任务规划 复杂任务自动拆解为可执行步骤序列
工具调用 内置基础工具(文件读写、本地搜索、计算器、系统信息等) ✅(部分工具需网络)
长期记忆 记住用户偏好、历史对话、执行经验
用户画像 自动沉淀用户习惯与偏好,无需手动配置
经验进化 从成功/失败任务中学习,优化后续策略
安全仲裁 敏感操作自动拦截并请求确认
本地数据存储 所有记忆和画像数据仅存本机,默认不上传

2.2 内置基础工具

工具 说明 离线可用
文件读写 读取、创建、编辑本地文件
本地搜索 在用户指定目录中搜索文件内容
计算器 数学表达式求值
系统信息 查看设备状态(内存、存储、网络)
天气查询 通过 API 获取天气信息 ❌(需联网)
网页搜索 通过搜索引擎 API 获取信息 ❌(需联网)
大模型调用 调用 LLM API 处理复杂语言任务 ❌(需联网,可选)

2.3 能力边界

能力维度 能做到的 做不到的
任务复杂度 多步骤任务(如“帮我整理上周的文档并按日期分类”) 需要实时多源数据融合的超复杂任务
记忆深度 记住用户偏好、历史对话、常用工具 像人类一样理解情感和潜台词
自主学习 从任务成功/失败中优化策略 无监督的领域知识发现
工具使用 调用已注册的工具,组合使用 自动发现和注册新的外部工具
推理能力 基于规则的意图解析和任务规划 需要大模型才能完成的深度语义理解
离线能力 所有核心功能离线运行 需要网络数据的任务(搜索、大模型调用)

2.4 与大模型的关系

场景 处理方式
简单意图解析 本地 ECC 模块完成,不调用大模型
结构化任务规划 本地 ECC 模块完成
记忆查询与存储 本地 MLNF-Mem 模块完成
复杂文本生成 可选调用 LLM API(用户可配置,默认不启用)
深度语义理解 可选调用 LLM API
多语言翻译 可选调用 LLM API

核心原则:大模型是一个可选的工具,不是 Agent 的大脑。 Agent 的大脑是 ECC 模块。大模型只在用户需要且网络可用时才被调用。

2.5 明确不属于基础版的功能

功能 原因
多设备数据同步 需要云端基础设施,属于企业版
多用户管理 需要权限系统,属于企业版
审计日志持久化 企业合规需求,属于企业版
高可用集群部署 企业运维需求,属于企业版

三、与 OpenClaw 的差异化定位

能力 OpenClaw EM-Core-Agent
工具调用
离线运行
本地数据存储
长期记忆体系 ❌(依赖大模型上下文) ✅(独立双漏斗记忆)
用户画像沉淀 ✅(漏斗一专用)
经验自我进化 ✅(五层晋升+三维重要度)
认知决策模块 ❌(依赖大模型推理) ✅(ECC 独立推理)
安全仲裁机制
端侧零依赖运行 ❌(无大模型时能力骤降) ✅(核心功能离线完整)

EM-Core-Agent 与 OpenClaw 共享“本地离线优先、个人免费部署”的爆火基因,同时叠加了一套完整的认知大脑 + 双漏斗记忆 + 安全仲裁体系,这是当前开源 Agent 生态中独一无二的能力组合。

四、双漏斗记忆系统(Agent-mlnf-mem)

4.1 双漏斗物理隔离

漏斗 定位 运行时机 存储内容
漏斗一:用户画像漏斗 懂人——记录个体偏好与习惯 每次交互时 用户偏好、对话历史、反馈记录、使用习惯
漏斗二:任务经验漏斗 练己——沉淀任务执行策略 每次工具调用完成时 执行策略、成功/失败案例、工具调用模式

隔离约束:

  • 双漏斗之间无数据交换、无经验融合
  • 漏斗一数据仅本地加密存储,不参与Agent自我进化
  • 漏斗二可脱敏泛化后跨用户复用

4.2 五层单向晋升通路

L1 临时层 → L2 近期层 → L3 中期层 → L4 长期层 → L5 核心层
(本次会话)  (近7日)    (近30日)   (泛化技能)  (永久锁定)

记忆仅可单向晋升,不可回退。晋升条件:留存时长达标 + 重要度达标。

4.3 三维重要度量化公式

重要度 I = I₀ + α·S + β·V + γ·C
驱动信号 Agent 语境定义
S(安全显著性) 涉及敏感操作、权限提升、数据访问等高安全风险事件
V(用户价值) 用户显式标记的重要对话或任务
C(复用频次) 同类任务中该策略被成功调用的次数

4.4 轻量化约束

  • 终身记忆总量上限:默认 100MB,可自定义扩展至设备存储上限
  • 漏斗一容量占比:40%
  • 漏斗二容量占比:60%
  • 逼近上限时自动清理低重要度条目

五、认知大脑(Agent-ecc-brain)

5.1 核心模块清单

编号 模块名称 核心职责
ECC-01 意图解析模块 将用户自然语言输入转化为结构化意图与实体
ECC-02 任务规划模块 拆解复杂任务为可执行步骤序列
ECC-03 工具选择模块 根据任务需求匹配最合适的工具
ECC-04 安全仲裁模块 审查工具调用方案,执行安全边界检查
ECC-05 记忆查询模块 向记忆中枢发起偏好与经验查询
ECC-06 结果评估模块 评估工具执行结果,触发记忆写入
ECC-07 工作记忆模块 缓存当前会话的推理中间数据
ECC-08 元认知模块 自我能力评估、置信度计算、求助触发
ECC-09 内生动机模块 主动发现用户需求、生成建议任务
ECC-10 社会心智模块 情绪感知与交互风格适配
ECC-11 抽象创造模块 从经验中提炼通用规则(高阶,需授权激活)
ECC-12 资源调度模块 唯一对外网关,统筹工具调用权限与LLM API配额

5.2 安全仲裁机制

操作类型 执行条件
读取文件 自动执行
写入文件 用户确认
网络请求 自动执行
代码执行 沙箱隔离 + 用户确认
涉及隐私数据 拦截并提示
修改系统配置 二次确认

六、行动执行层(Agent-mcc-exec)

6.1 核心模块清单

编号 模块名称 核心职责
EXEC-01 工具注册中心 管理可用工具目录及其参数约束
EXEC-02 API 调用引擎 安全地执行外部 API 请求
EXEC-03 代码执行沙箱 在隔离环境中运行代码
EXEC-04 结果校验器 验证执行结果是否符合预期
EXEC-05 执行偏差监控 对比目标结果与实际结果
EXEC-06 闭环反馈单元 汇总执行结果,上报认知大脑

6.2 执行约束

  • 仅执行认知大脑下发的工具调用指令
  • 不参与任何任务规划或工具选择
  • 所有执行结果结构化回传
  • 执行超时自动中断并上报

七、部署架构

7.1 本地为核,全端自由部署(默认离线优先)

EM-Core-Agent 默认以本地离线运行为核心范式,区别于传统依赖云端大模型、强制上传数据的AI Agent架构。整套认知大脑、记忆中枢、执行层可完整部署在用户个人终端,全程离线闭环、数据本机留存、不上传公共云端,最大化保障用户隐私与数据安全。

云端模式仅作为企业扩展增值能力,非个人用户必需依赖。

┌─────────────────────────────────────────┐
│      用户本地终端独立智能体(默认)        │
│  本地完整部署:ECC-Brain + MLNF-Mem + MCC-Exec │
│                                         │
│  电脑 / 手机 本机全量运行,离线可用        │
│  所有记忆、偏好、任务数据仅保存在本机      │
└─────────────────────────────────────────┘

7.2 可选云端扩展架构(企业商用增值模式)

企业用户可自行搭建私有云端中枢,实现多终端统一联动管理,仅作为商业版扩展能力:

┌─────────────────────────────────┐
│    企业私有云端大脑(可选增值) │
│   (仅企业商用场景部署)         │
└────────────┬────────────────────┘
             │ HTTP / WebSocket API
     ┌───────┴───────┐
     ▼               ▼
┌──────────┐   ┌──────────────┐
│ 电脑终端 │   │  手机终端    │
└──────────┘   └──────────────┘

7.3 部署方式

部署方式 适用场景 说明
本地单机部署(默认) 个人用户、开发者、学习研究 PC、手机均可本地完整部署全套认知+记忆+执行体系,全程离线运行、数据本机留存、非商用完全免费
Docker Compose 部署 开发测试、个人快速搭建 一键部署本地完整环境,全功能离线可用
企业云端集群部署 商业团队、企业服务场景 商业授权专属能力,支持多终端统一管理、云端协同、高可用集群

7.4 手机端部署方案

方案 说明 优势
PWA(渐进式Web应用) 通过浏览器安装到手机主屏幕,与本地Python后端通信 跨平台、零审核、自动更新
Termux + Python(Android) 在Android手机上直接运行Python核心 真正的离线端侧运行
微信小程序 在小程序平台运行 用户零安装成本、传播极快(未来规划)

7.5 运行环境说明

基础开源版本推荐运行环境:Python 3.10 及以上,Windows/Linux/macOS/移动端全平台兼容,支持个人终端完整离线部署使用。

系统默认不采集、不上传任何用户数据,原生具备高隐私特性。

八、与 EM-Core-HR/AD 的同源架构对照

三层架构 EM-Core-HR(人形机器人) EM-Core-AD(自动驾驶) EM-Core-Agent(AI Agent)
认知大脑 HR-ecc-brain(12模块×112子单元) AD-ecc-brain(12模块×47子单元) Agent-ecc-brain(约12模块)
记忆中枢 HR-mlnf-mem(60模块,单漏斗) AD-mlnf-mem(51模块,双漏斗) Agent-mlnf-mem(双漏斗,复用AD架构)
执行层 HR-mcc-cerebellum(54模块,全身运动) AD-mcc-cerebellum(38模块,车辆控制) Agent-mcc-exec(工具调用)

关键同源特性:

  • 记忆中枢均采用 MLNF-Mem 五层单向晋升与三维重要度驱动核心理论
  • 认知大脑均采用 ECC 12维认知模块架构
  • 执行层均遵循“只负责精准执行,不参与决策”的原则
  • 安全约束均内建于架构层级,不可绕过

九、开源协议与商业授权

9.1 基础版(本仓库及所有子仓库)

采用 CC BY-NC 4.0(署名-非商业性使用 4.0 国际许可证)进行全球开源授权。

  • ✅ 个人学习、研究、非商业用途可自由使用、修改、分发
  • ❌ 任何商业用途均被严格禁止

9.2 企业版(商业授权)

商业授权将提供:

  • 合法的商业使用权利
  • 企业级功能模块(多租户、审计日志、高可用)
  • 官方技术支持与 SLA 保障
  • 法律风险承担与合规背书

联系邮箱:710705008@qq.com

十、版本声明

内容
版本号 V1.0
阶段定位 架构总纲、模块划分、接口规范标准化定稿
配套仓库 Agent-ecc-brain / Agent-mlnf-mem / Agent-mcc-exec

十一、学术引用

文波福. EM-Core-Agent:AI Agent 具身认知核心系统——架构白皮书 V1.0[EB/OL]. 2026.

十二、联系方式

  • 原创提出者:文波福
  • 邮箱:710705008@qq.com
  • 首发平台:GitHub、Gitee、知乎、CSDN、稀土掘金

本文档为 EM-Core-Agent 架构白皮书 V1.0 正式版,统领 AI Agent 方向四个仓库的完整体系。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐