EM-Core-Agent：AI Agent 具身认知核心系统——架构白皮书 V1.0

EM-Core-Agent是一套基于EM-Core具身认知核心与MLNF-Mem记忆系统的AI Agent认知架构。其核心创新在于：1）采用"认知-记忆-执行"三模块解耦设计，2）构建双漏斗记忆体系实现用户隐私与任务经验的物理隔离，3）默认本地离线运行保障数据安全。系统严格遵循人类认知分工，通过五层晋升机制实现经验进化，解决现有Agent在长期记忆、行为一致性和隐私保护方面的痛点。架构与机器人、自

拓研C

98人浏览 · 2026-06-03 18:35:58

拓研C · 2026-06-03 18:35:58 发布

EM-Core-Agent：AI Agent 具身认知核心系统——架构白皮书 V1.0

版本：V1.0 ｜发布日期：2026年6月
核心架构原创提出者：文波福
适用领域：AI Agent、智能助手、自动化工作流、企业数字员工
底层架构：EM-Core 通用智能架构 + MLNF-Mem 多级嵌套漏斗记忆与经验中枢
同源适配：与 EM-Core-HR（人形机器人）、EM-Core-AD（自动驾驶）底层逻辑同源，仅做AI Agent场景专项适配
开源许可：CC BY-NC 4.0（署名-非商业性使用 4.0 国际许可证）

摘要

本白皮书正式提出一套以 EM-Core 具身认知核心与 MLNF-Mem 记忆经验中枢为底层理论的 AI Agent 认知系统。系统严格遵循人类认知分工，将记忆存贮、实时推理与工具执行解耦为三大独立模块，并引入双漏斗记忆体系，系统性解决了当前 AI Agent 面临的长期记忆混乱、行为缺乏一致性、用户隐私与经验泛化矛盾三大核心痛点。

与主流依赖云端大模型的 Agent 方案不同，EM-Core-Agent 默认以本地离线运行为核心范式。整套认知大脑、记忆中枢、执行层可完整部署在个人终端（PC、手机、边缘设备），全程离线闭环、数据本机留存，最大化保障用户隐私与数据安全。云端模式仅作为企业可选增值能力。

白皮书完整阐述系统架构、模块职责、数据流、安全红线与工程落地规范。架构底层与 EM-Core-HR 人形机器人认知系统、EM-Core-AD 自动驾驶认知系统思想同源、逻辑同源、架构同源，大幅降低跨领域智能系统研发成本。

一、系统总览与核心定位

1.1 核心定位

EM-Core-Agent 定位为 AI Agent 的原生 “大脑与记忆系统”，以 EM-Core 具身认知体系为顶层骨架，以 MLNF-Mem 记忆经验中枢为长期记忆内核，构建“认知-记忆-执行”全链路闭环。系统默认以本地离线运行，数据完全留存于用户设备，无需依赖云端基础设施。

与当前主流 AI Agent 方案的本质区别：

对比维度	当前主流 Agent	EM-Core-Agent
长期记忆	依赖大模型上下文窗口，容量有限	独立记忆中枢，轻量化终身记忆
用户画像	无隔离，混入提示词	双漏斗物理隔离，隐私本地加密
经验进化	无结构化经验沉淀	五层晋升+三维重要度，从单次经验到通用技能
安全可控	依赖提示词约束，易被绕过	安全仲裁模块，工具调用白名单+敏感操作确认
大模型依赖	强依赖，无大模型不可用	松耦合，核心功能离线完整，大模型仅作可选工具
部署模式	强制云端	本地优先，云端仅企业可选

1.2 核心模块构成

模块	全称	定位	一句话职责
双漏斗记忆系统	Agent-mlnf-mem	经验仓库	一漏斗懂人（用户画像），一漏斗练己（任务经验），物理隔离互不干扰
认知大脑	Agent-ecc-brain	实时思考	意图解析、任务规划、工具选择、安全仲裁、全部决策输出
行动执行层	Agent-mcc-exec	工具调用	工具注册、API调用、代码执行、结果校验的精准执行

1.3 系统架构拓扑

┌──────────────────────────────────────────────────────────────────┐
│                        EM-Core-Agent                             │
│                                                                  │
│  ┌──────────────────────┐        ┌──────────────────────────┐    │
│  │   Agent-mlnf-mem     │        │   Agent-ecc-brain        │    │
│  │   记忆中枢            │←──────→│   认知大脑                │    │
│  │                      │        │                          │    │
│  │ ┌──────────────────┐ │        │ ┌──────────────────────┐ │    │
│  │ │ 漏斗一:用户画像    │ │        │ │ 意图解析→任务规划     │ │    │
│  │ │ 偏好/习惯/反馈     │ │        │ │ →工具选择→安全仲裁    │ │    │
│  │ │ L1→L2→L3→L4→L5   │ │        │ └──────────────────────┘ │    │
│  │ └──────────────────┘ │        │                            │    │
│  │ ┌──────────────────┐ │        │                            │    │
│  │ │ 漏斗二:任务经验    │ │        │                            │    │
│  │ │ 执行策略/成败案例  │ │        │                            │    │
│  │ │ L1→L2→L3→L4→L5   │ │        │                            │    │
│  │ └──────────────────┘ │        │                            │    │
│  └──────────────────────┘        └────────────┬───────────────┘    │
│                                               │                   │
│                                               │ 工具调用指令       │
│                                               ▼                   │
│                                   ┌──────────────────────────┐    │
│                                   │   Agent-mcc-exec         │    │
│                                   │   行动执行层              │    │
│                                   │                          │    │
│                                   │ 工具注册 │ API调用        │    │
│                                   │ 代码执行 │ 结果校验       │    │
│                                   └──────────────────────────┘    │
└──────────────────────────────────────────────────────────────────┘

1.4 核心数据流

用户输入 → 认知大脑意图解析（本地）
认知大脑向记忆中枢查询用户偏好与历史经验（本地）
认知大脑完成任务规划与工具选择（本地）
安全仲裁模块审查方案，通过后下发工具调用指令（本地）
行动执行层执行工具调用，返回结构化结果
执行结果回采，经验片段写入记忆中枢
记忆中枢依据三维重要度公式自动筛选、晋升或遗忘

二、功能边界与能力范围

2.1 基础版功能清单（CC BY-NC 4.0 开源）

功能	说明	离线可用
对话交互	自然语言输入，自然语言输出，多轮对话记忆	✅
意图理解	解析用户意图，识别任务类型和实体	✅
任务规划	复杂任务自动拆解为可执行步骤序列	✅
工具调用	内置基础工具（文件读写、本地搜索、计算器、系统信息等）	✅（部分工具需网络）
长期记忆	记住用户偏好、历史对话、执行经验	✅
用户画像	自动沉淀用户习惯与偏好，无需手动配置	✅
经验进化	从成功/失败任务中学习，优化后续策略	✅
安全仲裁	敏感操作自动拦截并请求确认	✅
本地数据存储	所有记忆和画像数据仅存本机，默认不上传	✅

2.2 内置基础工具

工具	说明	离线可用
文件读写	读取、创建、编辑本地文件	✅
本地搜索	在用户指定目录中搜索文件内容	✅
计算器	数学表达式求值	✅
系统信息	查看设备状态（内存、存储、网络）	✅
天气查询	通过 API 获取天气信息	❌（需联网）
网页搜索	通过搜索引擎 API 获取信息	❌（需联网）
大模型调用	调用 LLM API 处理复杂语言任务	❌（需联网，可选）

2.3 能力边界

能力维度	能做到的	做不到的
任务复杂度	多步骤任务（如“帮我整理上周的文档并按日期分类”）	需要实时多源数据融合的超复杂任务
记忆深度	记住用户偏好、历史对话、常用工具	像人类一样理解情感和潜台词
自主学习	从任务成功/失败中优化策略	无监督的领域知识发现
工具使用	调用已注册的工具，组合使用	自动发现和注册新的外部工具
推理能力	基于规则的意图解析和任务规划	需要大模型才能完成的深度语义理解
离线能力	所有核心功能离线运行	需要网络数据的任务（搜索、大模型调用）

2.4 与大模型的关系

场景	处理方式
简单意图解析	本地 ECC 模块完成，不调用大模型
结构化任务规划	本地 ECC 模块完成
记忆查询与存储	本地 MLNF-Mem 模块完成
复杂文本生成	可选调用 LLM API（用户可配置，默认不启用）
深度语义理解	可选调用 LLM API
多语言翻译	可选调用 LLM API

核心原则：大模型是一个可选的工具，不是 Agent 的大脑。 Agent 的大脑是 ECC 模块。大模型只在用户需要且网络可用时才被调用。

2.5 明确不属于基础版的功能

功能	原因
多设备数据同步	需要云端基础设施，属于企业版
多用户管理	需要权限系统，属于企业版
审计日志持久化	企业合规需求，属于企业版
高可用集群部署	企业运维需求，属于企业版

三、与 OpenClaw 的差异化定位

能力	OpenClaw	EM-Core-Agent
工具调用	✅	✅
离线运行	✅	✅
本地数据存储	✅	✅
长期记忆体系	❌（依赖大模型上下文）	✅（独立双漏斗记忆）
用户画像沉淀	❌	✅（漏斗一专用）
经验自我进化	❌	✅（五层晋升+三维重要度）
认知决策模块	❌（依赖大模型推理）	✅（ECC 独立推理）
安全仲裁机制	❌	✅
端侧零依赖运行	❌（无大模型时能力骤降）	✅（核心功能离线完整）

EM-Core-Agent 与 OpenClaw 共享“本地离线优先、个人免费部署”的爆火基因，同时叠加了一套完整的认知大脑 + 双漏斗记忆 + 安全仲裁体系，这是当前开源 Agent 生态中独一无二的能力组合。

四、双漏斗记忆系统（Agent-mlnf-mem）

4.1 双漏斗物理隔离

漏斗	定位	运行时机	存储内容
漏斗一：用户画像漏斗	懂人——记录个体偏好与习惯	每次交互时	用户偏好、对话历史、反馈记录、使用习惯
漏斗二：任务经验漏斗	练己——沉淀任务执行策略	每次工具调用完成时	执行策略、成功/失败案例、工具调用模式

隔离约束：

双漏斗之间无数据交换、无经验融合
漏斗一数据仅本地加密存储，不参与Agent自我进化
漏斗二可脱敏泛化后跨用户复用

4.2 五层单向晋升通路

L1 临时层 → L2 近期层 → L3 中期层 → L4 长期层 → L5 核心层
（本次会话）  （近7日）    （近30日）   （泛化技能）  （永久锁定）

记忆仅可单向晋升，不可回退。晋升条件：留存时长达标 + 重要度达标。

4.3 三维重要度量化公式

重要度 I = I₀ + α·S + β·V + γ·C

驱动信号	Agent 语境定义
S（安全显著性）	涉及敏感操作、权限提升、数据访问等高安全风险事件
V（用户价值）	用户显式标记的重要对话或任务
C（复用频次）	同类任务中该策略被成功调用的次数

4.4 轻量化约束

终身记忆总量上限：默认 100MB，可自定义扩展至设备存储上限
漏斗一容量占比：40%
漏斗二容量占比：60%
逼近上限时自动清理低重要度条目

五、认知大脑（Agent-ecc-brain）

5.1 核心模块清单

编号	模块名称	核心职责
ECC-01	意图解析模块	将用户自然语言输入转化为结构化意图与实体
ECC-02	任务规划模块	拆解复杂任务为可执行步骤序列
ECC-03	工具选择模块	根据任务需求匹配最合适的工具
ECC-04	安全仲裁模块	审查工具调用方案，执行安全边界检查
ECC-05	记忆查询模块	向记忆中枢发起偏好与经验查询
ECC-06	结果评估模块	评估工具执行结果，触发记忆写入
ECC-07	工作记忆模块	缓存当前会话的推理中间数据
ECC-08	元认知模块	自我能力评估、置信度计算、求助触发
ECC-09	内生动机模块	主动发现用户需求、生成建议任务
ECC-10	社会心智模块	情绪感知与交互风格适配
ECC-11	抽象创造模块	从经验中提炼通用规则（高阶，需授权激活）
ECC-12	资源调度模块	唯一对外网关，统筹工具调用权限与LLM API配额

5.2 安全仲裁机制

操作类型	执行条件
读取文件	自动执行
写入文件	用户确认
网络请求	自动执行
代码执行	沙箱隔离 + 用户确认
涉及隐私数据	拦截并提示
修改系统配置	二次确认

六、行动执行层（Agent-mcc-exec）

6.1 核心模块清单

编号	模块名称	核心职责
EXEC-01	工具注册中心	管理可用工具目录及其参数约束
EXEC-02	API 调用引擎	安全地执行外部 API 请求
EXEC-03	代码执行沙箱	在隔离环境中运行代码
EXEC-04	结果校验器	验证执行结果是否符合预期
EXEC-05	执行偏差监控	对比目标结果与实际结果
EXEC-06	闭环反馈单元	汇总执行结果，上报认知大脑

6.2 执行约束

仅执行认知大脑下发的工具调用指令
不参与任何任务规划或工具选择
所有执行结果结构化回传
执行超时自动中断并上报

七、部署架构

7.1 本地为核，全端自由部署（默认离线优先）

EM-Core-Agent 默认以本地离线运行为核心范式，区别于传统依赖云端大模型、强制上传数据的AI Agent架构。整套认知大脑、记忆中枢、执行层可完整部署在用户个人终端，全程离线闭环、数据本机留存、不上传公共云端，最大化保障用户隐私与数据安全。

云端模式仅作为企业扩展增值能力，非个人用户必需依赖。

┌─────────────────────────────────────────┐
│      用户本地终端独立智能体（默认）        │
│  本地完整部署：ECC-Brain + MLNF-Mem + MCC-Exec │
│                                         │
│  电脑 / 手机 本机全量运行，离线可用        │
│  所有记忆、偏好、任务数据仅保存在本机      │
└─────────────────────────────────────────┘

7.2 可选云端扩展架构（企业商用增值模式）

企业用户可自行搭建私有云端中枢，实现多终端统一联动管理，仅作为商业版扩展能力：

┌─────────────────────────────────┐
│    企业私有云端大脑（可选增值） │
│   （仅企业商用场景部署）         │
└────────────┬────────────────────┘
             │ HTTP / WebSocket API
     ┌───────┴───────┐
     ▼               ▼
┌──────────┐   ┌──────────────┐
│ 电脑终端 │   │  手机终端    │
└──────────┘   └──────────────┘

7.3 部署方式

部署方式	适用场景	说明
本地单机部署（默认）	个人用户、开发者、学习研究	PC、手机均可本地完整部署全套认知+记忆+执行体系，全程离线运行、数据本机留存、非商用完全免费
Docker Compose 部署	开发测试、个人快速搭建	一键部署本地完整环境，全功能离线可用
企业云端集群部署	商业团队、企业服务场景	商业授权专属能力，支持多终端统一管理、云端协同、高可用集群

7.4 手机端部署方案

方案	说明	优势
PWA（渐进式Web应用）	通过浏览器安装到手机主屏幕，与本地Python后端通信	跨平台、零审核、自动更新
Termux + Python（Android）	在Android手机上直接运行Python核心	真正的离线端侧运行
微信小程序	在小程序平台运行	用户零安装成本、传播极快（未来规划）

7.5 运行环境说明

基础开源版本推荐运行环境：Python 3.10 及以上，Windows/Linux/macOS/移动端全平台兼容，支持个人终端完整离线部署使用。

系统默认不采集、不上传任何用户数据，原生具备高隐私特性。

八、与 EM-Core-HR/AD 的同源架构对照

三层架构	EM-Core-HR（人形机器人）	EM-Core-AD（自动驾驶）	EM-Core-Agent（AI Agent）
认知大脑	HR-ecc-brain（12模块×112子单元）	AD-ecc-brain（12模块×47子单元）	Agent-ecc-brain（约12模块）
记忆中枢	HR-mlnf-mem（60模块，单漏斗）	AD-mlnf-mem（51模块，双漏斗）	Agent-mlnf-mem（双漏斗，复用AD架构）
执行层	HR-mcc-cerebellum（54模块，全身运动）	AD-mcc-cerebellum（38模块，车辆控制）	Agent-mcc-exec（工具调用）

关键同源特性：

记忆中枢均采用 MLNF-Mem 五层单向晋升与三维重要度驱动核心理论
认知大脑均采用 ECC 12维认知模块架构
执行层均遵循“只负责精准执行，不参与决策”的原则
安全约束均内建于架构层级，不可绕过

九、开源协议与商业授权

9.1 基础版（本仓库及所有子仓库）

采用 CC BY-NC 4.0（署名-非商业性使用 4.0 国际许可证）进行全球开源授权。

✅ 个人学习、研究、非商业用途可自由使用、修改、分发
❌ 任何商业用途均被严格禁止

9.2 企业版（商业授权）

商业授权将提供：

合法的商业使用权利
企业级功能模块（多租户、审计日志、高可用）
官方技术支持与 SLA 保障
法律风险承担与合规背书

联系邮箱：710705008@qq.com

十、版本声明

项	内容
版本号	V1.0
阶段定位	架构总纲、模块划分、接口规范标准化定稿
配套仓库	Agent-ecc-brain / Agent-mlnf-mem / Agent-mcc-exec

十一、学术引用

文波福. EM-Core-Agent：AI Agent 具身认知核心系统——架构白皮书 V1.0[EB/OL]. 2026.

十二、联系方式

原创提出者：文波福
邮箱：710705008@qq.com
首发平台：GitHub、Gitee、知乎、CSDN、稀土掘金

本文档为 EM-Core-Agent 架构白皮书 V1.0 正式版，统领 AI Agent 方向四个仓库的完整体系。

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

抗磁、抗窄、抗微动！Captiks全身惯性动捕系统攻克车内精细动作捕捉难题

DAMO开发者矩阵

爬坡类多足机器人

本文设计了一款轮足复合式多功能四足机器人救援平台，针对复杂灾害环境下传统救援装备的不足，融合仿生四足行走技术与智能担架系统。平台采用12自由度碳纤维四足底盘，搭载四段式自适应折叠担架，通过闭环电推杆实现±0.5°精度的急救体位调节，支持Fowler半卧位等临床标准姿态。集成剪叉升降与万向轮机构，实现轮足双模切换，兼顾快速转运与复杂地形越障。试验表明，平台可攀爬35°斜坡、跨越20cm障碍，担架晃动

DAMO开发者矩阵

气缸驱动并联机器人位姿控制策略【附仿真】

采用正弦扫频激励，测得-3dB带宽达到4.2Hz，比原控制器提高1.5Hz。在单轴阶跃响应测试中，稳态误差±0.12mm，调整时间0.28s，比传统PID缩短42%。并联平台轨迹跟踪正弦信号（幅值20mm，频率0.5Hz）时，最大跟踪误差1.8mm，均方根误差0.9mm。为提升系统频响，设计集成自适应架构，直接自适应项补偿参数不确定性，间接自适应项处理未建模动态。✨ 长期致力于气动并联平台、气动伺

DAMO开发者矩阵

所有评论(0)

查看更多评论

拓研C

@2601_95081863

已为社区贡献3条内容

EM-Core-Agent：AI Agent 具身认知核心系统——架构白皮书 V1.0

拓研C

EM-Core-Agent：AI Agent 具身认知核心系统——架构白皮书 V1.0

摘要

一、系统总览与核心定位

1.1 核心定位

1.2 核心模块构成

1.3 系统架构拓扑

1.4 核心数据流

二、功能边界与能力范围

2.1 基础版功能清单（CC BY-NC 4.0 开源）

2.2 内置基础工具

2.3 能力边界

2.4 与大模型的关系

2.5 明确不属于基础版的功能

三、与 OpenClaw 的差异化定位

四、双漏斗记忆系统（Agent-mlnf-mem）

4.1 双漏斗物理隔离

4.2 五层单向晋升通路

4.3 三维重要度量化公式

4.4 轻量化约束

五、认知大脑（Agent-ecc-brain）

5.1 核心模块清单

5.2 安全仲裁机制

六、行动执行层（Agent-mcc-exec）

6.1 核心模块清单

6.2 执行约束

七、部署架构

7.1 本地为核，全端自由部署（默认离线优先）

7.2 可选云端扩展架构（企业商用增值模式）

7.3 部署方式

7.4 手机端部署方案

7.5 运行环境说明

八、与 EM-Core-HR/AD 的同源架构对照

九、开源协议与商业授权

9.1 基础版（本仓库及所有子仓库）

9.2 企业版（商业授权）

十、版本声明

十一、学术引用

十二、联系方式

所有评论(0)

温馨提示：您尚未绑定手机号

拓研C