在智能体通信协议开发的过程中,我收集了行业已经出现的智能体通信协议,并且使用OpenAI的deepresearch,对协议的目标问题、关键技术、适用场景、技术架构、兼容性与扩展性、开源与生态以及未来发展前景等方面进行分析。有些地方可能不是十分的准确,但是用来参考是不错的。

我们去年初就启动了开源智能体通信协议的设计与开发工作,作为最早在这个领域研究的团队,我们能够十分明显的感受到,最近两三个月,这个领域正在受到越来越多的人的关注。

欢迎关注我们的开源项目,加入我们的开源社区,无论你是个人开发者,还是人工智能领域的公司,我们都十分的欢迎。智能体通信协议需要行业的共建,才能够具有更强的生命力。

联系我们

MCP(Model Context Protocol)

目标问题

面向大模型上下文接入

  • 解决AI模型与外部数据源整合困难、上下文割裂的问题。
  • 提供统一标准让LLM便捷安全地访问各种内容库、工具和环境,打破数据孤岛,避免每个数据源各自定制集成。

关键技术

开放RPC框架

  • 基于JSON-RPC 2.0定义标准的请求/响应/通知消息格式。
  • 引入能力协商机制,客户端和服务端可动态商定支持的协议功能(含细粒度子功能),增强灵活性和扩展性。
  • 目前提供本地双向流通信(如标准IO管道、HTTP+SSE流式输出);远程通信的身份认证、服务发现等在路线图中。
  • 理念上充当AI应用的"USB-C接口"。

适用场景

AI应用集成

  • 适用于需要将LLM嵌入业务系统、快速接入多种数据源和工具的场景,如企业知识库问答、编程助手对接代码库/IDE、办公助手访问日历邮件等。
  • 通过MCP,开发者可为LLM提供统一接口连接数据库、云文档、开发环境等。
  • 目前主要用于本地或内网环境下Agent对接内部工具,随着远程支持加入,可扩展到跨服务的云端Agent集成。

技术架构

客户端-服务器架构

  • MCP将AI模型这一侧视作客户端,外部数据源封装为MCP服务器。
  • 双方通过定义好的JSON消息交换,模式类似RPC调用。
  • 传输层当前支持本地管道(标准输入输出流)和HTTP长连接+SSE(Server-Sent Events单向流)实现请求/响应或流式消息
  • 每种传输有各自消息交换模式要求。
  • 目前限定在本机或内网通信,以确保安全简单(无连接即无远端身份问题)。
  • 未来计划加入远程连接能力,涉及认证授权、服务发现和无状态操作等功能。
  • 因此架构上MCP偏向一对一的模型与资源服务通信,类似插件调用,本身不负责多Agent路由。

兼容性与扩展性

集成简易

  • MCP采用JSON/HTTP等通用技术,实现细节透明度高,已有Claude等支持MCP客户端,本地部署简单。
  • Anthropic开源了规范和SDK,并提供了一系列流行系统(Google Drive、Slack、GitHub等)的MCP服务器示例,方便直接接入。
  • 由于协议开放,其他大模型(如开源LLM)也可遵循实现,从而跨模型通用。
  • 目前MCP缺乏远程调用能力,但未来加入认证和联网后,将能适配微服务、云API等场景。
  • 能力协商机制允许新增功能模块而不破坏兼容,已有客户端可协商后再利用新功能,扩展性良好。
  • 整体易与现有系统结合(尤其REST风格服务),可作为LLM插件标准组件。

开源与生态

Anthropic开源标准

  • MCP规范和部分实现SDK已开放。
  • Anthropic还在Claude桌面应用中加入本地MCP服务器支持,示范数据接入。
  • 目前初期生态包括一些先行集成者:Block公司、Apollo等已将MCP纳入系统,开发工具公司如Zed、Replit、Codeium、Sourcegraph等正合作将MCP用于代码相关Agent增强。
  • 社区在Github上维护MCP规范,也出现第三方工具(有人开源了MCP可视化管理客户端等)。
  • 由于2024年底才发布,生态起步阶段但关注度高,大厂支持和讨论热烈(如Reddit开发者讨论MCP突破之处)。
  • MCP以开放许可发布,鼓励社区贡献传输机制、服务器实现等。
  • 未来随着远程功能上线、更多LLM兼容,MCP生态有望扩张为类似"LLM插件市场"的格局。

未来发展前景

短期领先,待拓展

  • MCP背靠Anthropic和早期实践者,在近期有望成为事实标准之一,用于LLM工具接入方面。
  • 随着远程功能补齐,MCP可能迅速扩展适用范围,在企业应用中站稳脚跟。
  • 其优势在于简单实用,对开发者友好,有大厂推动生态。
  • 然长期看,MCP目前缺少去中心化身份和多Agent交互能力,在构建大规模Agent网络方面或受限。
  • 如果Anthropic和社区持续迭代,增加身份认证等模块,MCP或演进成更通用协议。
  • 综合来说,MCP在大模型上下文整合领域前景光明,可能成为"AI时代的USB接口";但在Agent互联宏图中需与其他协议配合。

ANP(Agent Network Protocol)

目标问题

面向智能体互联

  • 解决多智能体彼此通信协作缺失的问题,被称为"Agent界HTTP"愿景。
  • 重点攻克智能体网络中的身份信任与连接难题,实现跨平台、多主体的直接交流,支持智能体自动组成网络协同工作。

关键技术

三层架构+去中心化身份

  • 采用W3C去中心化身份DID标准构建身份层,实现无中心可信认证和端到端加密通信。
  • 设计自有DID方法,用密码学替代中心机构,兼顾去中心化与可大规模落地。
  • 引入元协议层,即"协议的协议",允许智能体用自然语言自动协商通信协议并生成应用层协议代码,实现自主对接和协议升级。
  • 具备身份认证、加密通信、元协议协商、应用层协议描述等完整栈能力。
  • 智能体可借助LLM自动组织网络、协商通信方案,实现无人参与的自组网协作。

适用场景

多Agent协作

  • 适合构建去中心化的智能体网络,如个人AI助手直接与第三方服务代理通信、物联网设备的智能代理彼此协商行动,或多个自治Agent组成联盟完成复杂任务等。
  • 由于支持身份认证和加密,尤其适用于对安全要求高、缺乏统一信任中心的场景(例如跨平台个人数据整合)。
  • 还能用于研究性Agent社区,让不同团队的Agent按照开放协议互动。

技术架构

点对点网状

  • ANP采用去中心化P2P思路,智能体间可直接建立加密通信连接。
  • 通过DID身份交换和验证来建立信任,再协商通信协议和格式。
  • 架构上分为三层:底层身份与加密层保证信道安全可信;中间元协议层负责在两Agent间(或多Agent)自动谈判采用何种应用协议;上层应用协议层执行具体业务数据交换,Agent可依据语义描述选择或生成该层协议。
  • 这种架构让Agent网络可类似人际网络般松耦合:没有单点服务器,全凭Agent发现彼此并连接。
  • 实现上可跑在现有Web基础设施上(如WebSocket或P2P库),官方已有AgentConnect实现提供框架。
  • 网络拓扑支持多跳组网,Agent可动态寻找满足条件的其他Agent协作,不局限于集中服务器。

兼容性与扩展性

开放且完善

  • ANP完全开源(提供规范和参考实现),设计时考虑与现有Web标准结合(如基于DID标准、语义Web)。
  • 能够支持各种Agent框架,只要实现身份认证和元协议层,就能加入ANP网络。
  • 分层结构清晰,各层可以替换或升级(如未来换用新加密算法、增加新的应用层协议类型)。
  • 通过语义能力描述,第三方可以定义新的Agent能力并在协商时识别利用。
  • 兼容性方面,ANP的协议文档和代码均提供中英文版本,降低集成门槛。
  • 由于去中心化设计,不依赖特定平台,互联网参与者都可实现自己的ANP Agent。
  • 理论上还能桥接现有协议:现有服务如果实现Agent代理并支持DID认证,也能与ANP代理通信。
  • 因此ANP可平滑扩展成庞大网络,瓶颈在于业界采纳率。

开源与生态

国内开源先行者

  • ANP由中国团队(常高伟等)开发并开源,规范与代码在GitHub公开。
  • 作为较早提出的智能体通信协议,已引起国内AI开发圈关注,被称为行业首个真正的Agent通信协议。
  • 目前生态包括一个AgentConnect实现框架和配套DID方法规范。
  • 社区主要在国内交流,CSDN等有多篇解析教程。
  • 但在全球范围知名度相对有限,有待更多国际开发者参与。
  • ANP紧跟前沿(其元协议思想与牛津Agora不谋而合),如果能凝聚社区完善标准、提供多语言SDK,可能成为Agentic Web的重要一环。
  • 其开源协议友好,欢迎商业和个人试用。
  • 在国内,ANP有望与本土大模型/应用结合形成生态;在国外,需宣传以吸引开发者加入生态共建,实现真正全球互联的Agent网络。

未来发展前景

技术全面,亟待生态

  • ANP在理念上超前,提前解决了身份信任和自动协商难题,技术成熟度高(已实现端到端网络通信)。
  • 这让其在未来开放Agent网络竞争中占据先机。
  • 如果能获得广泛采用,ANP有潜力成为Agentic Web的底层通信框架。
  • 然而目前ANP主要由国内团队推动,国际影响力相对弱,生态规模是隐忧。
  • 未来优势能否兑现取决于:其一,是否能吸引更多开发者和组织加入完善生态;其二,大公司会否支持DID这一路线。
  • 如果去中心化Agent网络成为趋势(例如Web迈向无中心身份),ANP将大放异彩。
  • 反之若巨头更倾向私有协议,ANP可能成为小众标准。
  • 但考虑到MCP团队也意识到开放身份的重要,ANP走在前面的设计有望被参考或融合,保持领先地位。

Agora (牛津大学元协议)

目标问题

面向LLM智能体网络的三难困境

  • 试图同时实现通信的高多功能性、效率和可移植性
  • 针对当前每个模型封闭孤立、难以互通的现状,提出利用大型模型自身能力来自适应不同场景的通信方案,构建可扩展的"世界级LLM智能体网络"。

关键技术

LLM驱动的元协议

  • 核心创新是**协议文档(PD)**机制,以纯文本描述通信协议。
  • Agent可将协议描述作为可传输对象,用哈希值唯一标识协议而无需中央注册。
  • 利用LLM的三大能力:自然语言理解与生成、遵循指令编写代码、复杂情境下自主协商,Agora允许智能体针对不同场景采用不同通信格式。
  • 常见高频交互采用已有高效协议/例程处理,以提升效率;不常见或无标准协议的场景,则Agent间以结构化数据或自然语言协商新的协议方案,由LLM动态生成并执行对应例程。
  • 这种自适应层次实现兼顾了高通用性(几乎任何内容都能交流)、高效率(常用路径优化)和高可移植性(LLM自动处理协商与实现,无需人工干预)。

适用场景

前沿研究和高复杂度任务

  • Agora目前主要在学术实验场景验证。
  • 适用于需要高度灵活协议的多Agent环境,如研究型多智能体系统,让Agent自行演化沟通方法。
  • 比如不同任务需求下,Agent动态协商最优通信方式以提高协作效率,或在未知环境中即时创造交流协议解决新问题。
  • 这在AGI研究、大规模Agent仿真中有价值。
  • 短期内Agora更多用于概念验证,如实验LLM能否自动生成协议解决特定任务(论文中展示了两个场景实验)。
  • 未来若成熟,可应用于规模和异质性极高的Agent网络,因为无需预先标准化所有交互。

技术架构

自适应层协议栈

  • Agora并非固定的网络拓扑协议,而是赋予Agent一套在不同抽象层切换通信方式的策略。
  • 可以理解为在Agent内部实现了一个**“协议路由器”**:当Agent A与B通信时,它先检查是否有适用的高效既定协议(PD已知且双方实现了)可用,如有则直接采用(例如标准API调用或自定义二进制协议)。
  • 若无,则退而求其次尝试结构化数据交换,比如双方基于JSON表述往返,必要的解析和构造例程由LLM即时编写。
  • 如果再复杂或协商遇到异常,则降级为自然语言沟通:两个Agent直接用LLM生成的人类语言描述需求和数据,让对方LLM解析执行。
  • 这种架构等于在应用层动态选择通信协议,底层仍需有基本连通性(可假定通过已有网络/socket连接传输文本流)。
  • Agora将协议本身作为可协商内容,通过传递协议文档PD达成一致后,再进行具体数据交换。
  • 因此拓扑本质上是对等通信(任意Agent对话),可运行在现有网络之上,但通信内容层次非常灵活。
  • Agora被称为"零层协议",意味着它定位于元层协调各具体协议之上,为LLM之间的高阶协作提供基础。

兼容性与扩展性

概念验证阶段

  • Agora源自学术论文,当前没有成熟工业实现,可移植性体现在理论上兼容各类协议描述(大多数现有RFC都可用作PD)。
  • 因此若实现,将能直接利用大量既有协议标准,Agent只需能获取对应PD文本并拥有执行/解析能力。
  • 扩展性方面几乎无限:任何新协议只要以文本形式描述即可纳入体系,由LLM负责理解和部署。
  • 不过这也对LLM能力要求高,需足够强的模型正确生成和解析协议代码。
  • 目前兼容性主要取决于Agent具备足够知识和工具库来执行LLM产出的协议(例如生成了Python代码去通信,则Agent环境需能运行)。
  • Agora避免了中心化注册协议ID,采用哈希标识降低全局协调需求。
  • 随着Agent交互次数增多,可能形成协议文档共享库(去中心化分发)。
  • 总的来说,Agora设计上包容一切通信范式,但在统一实现之前,各团队实验可能各自为政。
  • 近期生态主要是研究社区关注,其开源与否取决于论文作者团队;若开源代码,可能会有早期爱好者试用。
  • 长远看,一旦LLM充分胜任自动协议生成,这种架构可自适应扩展到任何新设备和通信需求。

开源与生态

学术引领

  • Agora源于牛津大学团队论文(2024年10月提交),目前生态主要是学术讨论和评价。
  • Machine Learning社区对其"三难困境"定义和解决方案反响较好,Reddit上有少量讨论关注它的创新性。
  • 但尚未有开源框架实现Agora思想——可能因其依赖较新的LLM能力。
  • 在没有代码前,生态停留在理论层。
  • 一些研究者可能会基于论文自行试验,用GPT-4等实现局部功能来验证可行性。
  • 这属于前沿探索,短期不会有商业应用加入生态。
  • 然其理念或影响其他项目:例如ANP元协议部分与Agora思路类似,可算是一种生态呼应。
  • 如果Agora证明有效,未来Agent框架可能融入其思想,将LLM对协议的灵活适应作为功能添加,而未必要完全照搬Agora架构。
  • 作为开放论文,其概念任何人可用,无限制。
  • 若作者或开源社区后来实现参考代码并上传GitHub,才会正式开启开发者生态。
  • 目前则主要在论文引用和学术研讨层面构建"生态"。

未来发展前景

远景壮阔,路径曲折

  • Agora代表一种极富前瞻性的方向——让AI自主定义通信方式,从而突破人为协议限制。
  • 远未来,如果智能体达到更高智能水平,Agora这种自适应通信或成为默认:Agent之间无需人规定规则,能自动创造最优交互协议协作任务,真正实现机器社会的自组织。
  • 因此Agora的概念对AGI时代有深远意义,被视作未来高阶协议雏形。
  • 但其短期前景有限:受制于当前LLM能力和可靠性,Agora方案在现实环境中尚难落地。
  • 可能率先应用于研究模拟,并为后续协议提供借鉴(ANP的设计已体现出类似思想融合)。
  • 若几年内LLM技术和自动代码执行技术取得突破,Agora或许会从论文走向实现,到那时可能以新名字、新标准呈现。
  • 可以预见,大公司亦关注这一思路,可能在自家Agent系统中偷偷试验。
  • 在标准层面,Agora未来若验证成功,可能激发新一代协议标准制定,将"三难困境"理念融入协议设计。
  • 总而言之,Agora更像未来棋局中的关键概念,其优势将在长期竞争中逐步体现:当传统协议无法涵盖的场景出现,它提供了解决思路。
  • 所以尽管眼下并非竞技场主角,但从长远看,Agora开创的范式可能深刻影响后来者,甚至最终胜出成为智能体通信基础。

agents.json

目标问题

面向网站/服务的Agent可访问性

  • 提供一种开放标准,让网站声明如何被自主代理(Agents)发现和交互。
  • 解决当前AI Agent需要爬取人类界面、缺乏机器可读接口的问题,通过agents.json文件让站点明确提供Agent友好的接口位置、权限要求和交互规则。
  • 同时引入Agent身份验证机制,减少未知自动化带来的风险。

关键技术

Web声明式标准

  • robots.txt/sitemap.xml启发,以机器可读JSON文件定义站点支持的Agent接口
  • 包含站点信息、可用API端点及其输入输出模式、认证方式(如OAuth2)、所需权限范围、使用政策(速率限制、服务条款)等。
  • 通过约定路径(如/.well-known/agents.json)供Agent自动发现。
  • 支持版本字段及自定义扩展,保证演进兼容。
  • 还可链接Agent身份验证机制,让站点要求代理表明身份及权限。
  • 总体提供结构化能力宣告,减少解析网页的歧义和摩擦。

适用场景

Agentic Web

  • 应用于网站/开放API提供方希望向AI代理开放服务的场景。
  • 任何在线服务(电商、航旅预订、政务数据接口等)可通过配置agents.json声明机器接口,使AutoGPT之类代理直接发现功能端点并调用,而非模拟人工点网页。
  • 也适用于企业内部API目录:公司内部可用agents.json罗列各部门服务接口,方便企业内的AI代理自动发现和集成。
  • 总之,agents.json是Web层面的协议,适用行业广泛,只要有网站希望被AI高效访问即可使用。

技术架构

声明+标准接口

  • agents.json本身不定义通信通道,而是融入现有Web架构。
  • 通常代理首先通过HTTP **GET获取/agents.json**文件(可能在站点根目录或well-known路径)。
  • 文件内容描述了可用的API端点(往往是HTTP RESTful接口、GraphQL或WebSocket端点)及如何调用,所以实际通信模式取决于文件列举的接口类型。
  • 例如文件可指示Agent应调用某URL执行POST提交订单,或通过某WebSocket订阅消息。
  • 因而agents.json充当元数据层,上层实际通信可能走RPC、REST或消息队列等已有模式。
  • 它也可引用开放API文档或Schema,使代理按照给定数据格式构造请求。
  • 整个架构与Web高度兼容:通过DNS找到站点->取agents.json->按其中定义的接口标准交互。
  • 因此通信可以是客户端-服务器(代理作为客户端调服务API),也可以在未来拓展P2P元素(比如agents.json指向去中心化服务地址)。

兼容性与扩展性

对现有Web友好

  • agents.json是对网站的轻量扩展,采用标准HTTP文件形式,极易集成:站点开发者只需编写JSON声明(可部分生成自已有的OpenAPI文档),将其托管在固定URL即可。
  • 对客户端Agent来说,解析JSON也比解析HTML简单很多,许多现有HTTP库即可完成获取。
  • 兼容现有身份体系:可引用站点已有OAuth2等认证流程。
  • 工具和框架无依赖:任何语言的Agent都能读JSON,根据内含描述调用HTTP接口,用已有网络协议实现实际操作——没有特殊运行库要求。
  • 扩展性强,标准允许自定义字段/命名空间来试验新功能,同时包含版本字段避免旧Agent解析错误。
  • 由于尚是提案阶段,需社区推动形成共识或W3C标准。
  • 一旦标准化,其生态潜力巨大:浏览器厂商、爬虫和Agent框架都可支持自动发现agents.json来增强自动化。

开源与生态

草案倡议阶段

  • agents.json目前只是概念提案。
  • 由社区(Reddit讨论和AgentProtocol社区)综合提出想法,并未正式定稿。
  • 尚无官方组织背书,但可能在W3C或开放WEB联盟讨论。
  • 尽管如此,其理念简单易行,已有部分开发者关注。
  • 类似的想法也出现在一些媒体文章,引发对Agent爬虫友好性的讨论。
  • 由于实现成本低,一些前沿网站可能尝试放出agents.json作为实验。
  • 如果形成草根实践,标准组织可能顺水推舟制定规范。
  • 生态现状以倡议和讨论为主,Github上可能有示例仓库或JSON模式草案供参考。
  • 和MCP等需要双边实现不同,agents.json更依赖站点支持:只有网站普遍添加,Agent生态才能真正用起来。
  • 大型内容提供商(搜索引擎、社交平台)若率先采纳,将极大推动生态。
  • 而开源Agent项目(AutoGPT等)若开始自动查找agents.json,也能倒逼站点跟进。
  • 总体而言,其生态发展取决于双向:站点意愿和Agent工具支持。

未来发展前景

有望成Web标准配角

  • agents.json理念简单却意义重大,顺应了Web从"面向人"到"面向Agent"演进的需求。
  • 未来若大模型Agent泛用,站点不得不考虑机器访客,类似robots.txt的Agent协议极可能诞生。
  • agents.json正好填补这一空白,其优势在于兼容现有网络、部署成本低,容易成为行业共识。
  • 预期在不久将来,经过社区推动,可能由W3C提出正式标准并有浏览器/搜索引擎支持,这将奠定agents.json的地位。
  • 它不会取代其他通信协议,而是作为配套标准广泛存在:例如MCP或AITP的Agent,在访问Web服务前也可先查agents.json确定调用方式。
  • 长远看,agents.json几乎必然融入Agent生态,其前景取决于普及速度和细节制定。可以说,它在未来胜算很高,有望成为"Agent友好型网站"的标配配置文件。

LMOS(Language Model Operating System)

目标问题

面向多智能体系统基础设施

  • 致力于打造开放的多智能体平台与生态,降低开发和部署复杂度。
  • 解决各Agent平台互不兼容、扩展困难和调度管理复杂的问题。
  • 提供如同操作系统般的统一环境,让异构智能体易于发现彼此能力并高效通信、协同处理任务。

关键技术

开放多智能体架构

  • 提供Agent描述格式用于标准化描述Agent/工具能力和元数据,以语义抽象确保跨平台互操作。
  • 实现发现机制:本地通过mDNS广播发现,跨网络通过集中注册中心登记查询。
  • 提供Agent注册库充当目录服务,支持按能力元数据搜索匹配合适Agent。
  • 通信协议灵活可插拔,不强制单一传输,允许根据Agent需要选择HTTP、消息队列(MQTT/AMQP)或P2P等最佳方案。
  • 支持Agent分组管理,建立信任关系的组合作业。
  • 还提供Agent ReaCtor框架抽象LLM、记忆和工具接口,充当Agent的虚拟"操作系统"内核。
  • 通过NLU驱动的路由和任务分配,实现智能任务调度到最合适的Agent。

适用场景

企业级多智能体系统

  • LMOS适合需要部署和管理大规模智能代理的场景,如呼叫中心的众多对话代理、客服助手集群,或大型自动化工作流中不同专长的Agent协同。
  • 特别在多渠道(网页、移动、语音IVR)提供Agent服务、需要弹性伸缩的情况下,LMOS的云原生架构可发挥作用。
  • 也适用于研发测试多Agent生态,在统一平台上实验不同Agent框架的协同。
  • 由于强调无厂商锁定,企业或研究机构可以将已有的LangChain、LlamaIndex等Agent集成进LMOS统一管理。

技术架构

云端集群+总线

  • LMOS架构包含控制平面运行时
  • 控制平面包括中央Agent注册服务调度路由器
  • 各Agent(可由不同框架实现)在启动时向注册中心登记其能力说明和通信地址。
  • Router基于自然语言解析的任务内容匹配合适Agent,进行RPC调用或消息投递
  • LMOS支持WebSocket子协议用于Agent通信(提示其文档中有WebSocket子协议规范)以及HTTP接口等。
  • 在集群内部,Agent间通信可能通过发布/订阅消息总线或直接的网络调用,LMOS负责在不同协议间转换并保障可靠投递。
  • 拓扑上多数场景为星型:中央Router接收用户请求或Agent消息,再路由给目标Agent或广播给组。
  • 对于本地网络,mDNS让Agent彼此发现并直连简易通信;跨越子网则借助注册中心中转。
  • LMOS运行时基于Kubernetes,Agent实例以容器形式水平扩展。
  • 它提供生命周期管理(如滚动升级、灰度发布)确保系统稳定。
  • 总体通信模式既支持请求-响应(Router->Agent->Router)也支持事件驱动(Agent推送消息经由Router给订阅者)。

兼容性与扩展性

跨框架互操作

  • LMOS以开放标准为理念,支持将不同语言、不同Agent框架接入。
  • 官方已适配如LangChain、Langchain4j、LlamaIndex等,使其无缝作为LMOS Agent运行。
  • 采用Kubernetes等通用云技术,对运维团队友好。
  • 模块化设计提供丰富插件点:开发者可扩展新工具接口、新调度策略或自定义协议支持。
  • 比如可以接入自有消息队列系统替换默认通信,或添加自定义监控。
  • LMOS的可观察性安全/隐私模块保证企业合规需求。
  • 通过标准描述格式和注册API,可以与外部现有系统交换Agent元数据,甚至对接别的Agent平台(理论上不同LMOS部署间也能互通)。
  • 唯一门槛是LMOS体系相对完整庞大,引入需一定架构调整,但长远看避免厂商锁定,利于扩展。
  • 可扩容性经过设计,可随业务增长添加成百上千Agent节点而架构不变。

开源与生态

Eclipse基金会孵化

  • LMOS作为Eclipse开源项目,具备企业可信度。
  • 当前处于孵化阶段(Incubation),核心代码和文档开放在Eclipse平台。
  • 支持该项目的可能有企业和社区开发者,Eclipse官方站点提供了详尽文档和愿景说明,表明其野心。
  • 生态上,LMOS立足整合已有开源Agent框架,实际上把别的项目成果纳入自身生态(如ARC框架、各LLM适配)。
  • 因此,它更像一个生态融合者。
  • 目前暂无大规模应用案例公开,更多是概念验证和试点(可能在一些公司内部PoC)。
  • 随着多Agent概念升温,LMOS社区或吸引更多贡献者编写Adapter、部署案例。
  • Eclipse的背书也利于政府、企业采用。
  • 若能形成联盟(比如多个厂商基于LMOS标准交互),生态将稳步扩大。
  • 现阶段,官方正努力推广LMOS理念,发表博客、文档吸引开发者。
  • 长期看,其生态成败取决于是否能成为事实标准:如被大型AI公司或云提供商集成作为Agent管理层,那么LMOS将获得源源不断的社区资源支持。

未来发展前景

潜力巨大但需协作

  • LMOS描绘了一个全面的多Agent操作系统蓝图,契合未来企业和云端对大规模Agent管理的需求。
  • 它的优势在于全面:涵盖从开发框架到部署运维的一站式方案,若成功,将极大降低大规模应用AI Agents的门槛。
  • 凭借Eclipse组织和开放社区,LMOS有机会成长为行业基础设施。
  • 不过也面临挑战:竞争协议(如MCP、AITP)专注某一层面更精简,可能更快流行;LMOS需要证明其庞大架构的实用性和性能。
  • 未来几年,LMOS或先在垂直领域试点(如某大型企业内部全面采用),借成功案例推动标准化。
  • 如果业界趋向多协议并存,LMOS也可凭灵活适配性整合其他标准,成为各协议的"元操作系统"。
  • 因此LMOS的前景在于两条路径:要么自身成为主流多Agent平台标准,要么作为整合框架支持不同协议共存。
  • 不管哪种,随着Agent系统复杂度提升,它具备独特价值,前途看好。
  • 但短期内,其生态成熟度还有待提高,推广节奏可能慢于专用协议。

AITP(Agent Interaction & Transaction Protocol)

目标问题

面向智能体安全交互与交易

  • 解决AI代理跨信任边界通信与交易的问题。
  • 提供标准让不同组织/个人的Agent可以安全自主地沟通、达成协议和进行价值交换(支付等),支撑"Agent互联网"中代理之间以及人与代理之间的互动与交易。
  • 以统一协议取代当前割裂的接口,使Agent像浏览器访问网站一样自由交互任何服务。

关键技术

线程会话+可扩展能力

  • 采用类似聊天线程的交互模型(参考OpenAI的Assistant Threads API),在对话上下文中进行结构化消息交换。
  • 定义Thread抽象及多种传输方式(如HTTP、WebSocket)来建立持久通信会话。
  • 通过能力模块扩展,实现结构化交互类型:如支付请求(AITP-01)、决策协商(AITP-02)、数据查询(AITP-03)、链上身份/钱包验证(AITP-04/05)等。
  • 这些能力以标准消息格式嵌入对话,让Agent不仅能发文本,还能交换表单UI、付款凭据等复杂数据。
  • 安全方面,强调跨信任主体的消息签名和验证,确保不同实体Agent交互可信。
  • 整套协议支持交易事务(包括加密货币或法币支付),让Agent直接完成经济行为。

适用场景

泛在Agent交互

  • 适用于构建"Agent互联网"的场景,即不同组织或个人的AI代理需要直接通信和交易的环境。
  • 如个人数字助理与银行/航空公司的Agent直接沟通办理业务、自动执行支付;又如多个公司各自的AI Agent在供应链上谈判下单。
  • 这类场景要求标准化的对话接口和交易协议,AITP 提供了结构化对话和支付能力,适合在线服务市场、Agent微服务、跨域代理合作等应用。
  • NEAR等区块链生态的Agent也是目标用户,可借助AITP打通链上链下交互,实现价值交换(如代币支付)驱动的Agent服务。

技术架构

会话驱动交互

  • AITP将每段对话视为线程,由发起方打开与另一个Agent或用户的会话。
  • 线程有唯一ID,可在不同传输通道承载,例如HTTP长轮询、WebSocket、信箱式中继等。
  • 在线程内,通信采用消息体+元数据形式,兼容普通聊天消息结构又可承载特定"能力"消息。
  • 例如,当需支付时,发送一条包含支付请求能力的消息,对端Agent解析后通过钱包模块完成支付流程。
  • AITP定义的能力消息类似于RPC的扩充——在对话语境中完成事务。
  • 因此架构上是对等Agent间的会话式通信,结合了对话上下文和远程调用的特点。
  • 一方面任何Agent都可以既作为服务端又作为客户端参与线程(类似用户双方聊天);另一方面,引入标准化的功能模块使一些消息类型有确定的处理流程(如支付能力就对应明确的多步交互规范)。
  • 身份验证依托底层已有账号体系(如NEAR区块链账号或常规OAuth),可在建立会话前或过程中交换凭证。
  • 总之,AITP架构让Agent通信像即时消息+交易协议的结合体,实现多主体松耦合对话,又能在需要时进入结构化事务模式。

兼容性与扩展性

开放标准+多生态

  • AITP以RFC形式开放,核心规范和参考实现代码都在GitHub上公开。
  • 协议对Agent开发框架无强依赖,只要遵循Threads API和能力接口即可,已有的对话式AI(如基于OpenAI ChatCompletion的代理)可较小改动接入,因为AITP特意与OpenAI对话格式基本兼容
  • 能力体系可扩展:新的能力模块可以通过定义消息类型加入,不影响旧模块运作。
  • 尤其交易相关能力,已设计兼容主流加密钱包和传统支付(NEAR Wallet/EVM Wallet),方便扩展更多支付方式。
  • 因为NEAR推动,AITP很可能首先在NEAR社区应用,并与区块链基础设施集成(如智能合约验证Agent行为)。
  • 但协议本身不依赖区块链,可被传统Web服务Agent采用。
  • 这种设计让AITP有望跨加密和Web领域两边扩张。
  • 要真正普及,需更多平台加入支持,如接入主流AI助手或浏览器Agent。
  • 目前NEAR AI Hub等已在整合,社区反响决定生态走向。

开源与生态

NEAR主导推进

  • AITP由NEAR基金会发起,核心作者包括NEAR联合创始人,因而自带区块链社区资源。
  • 已在2025年2月公布RFC征求意见并开放aitp.dev站点供文档和讨论。
  • NEAR AI Hub正集成AITP,NEAR生态的Agent(如去中心化客服等)将优先实践。
  • 同时NEAR邀请外部协作,表示愿与其他Agent开发者共建标准。
  • AI和区块链圈对此较关注:有加密媒体报道"AITP新标准诞生"。
  • 因包含支付交易能力,可能吸引金融科技类AI应用加入。
  • 开源层面,AITP代码以MIT或类似许可开放,鼓励社区贡献新能力模块。
  • NEAR的AI团队定期举办讨论(Office Hours)促进生态。
  • 潜在风险是AITP是否能超越NEAR圈,被更广泛AI社区接受;但其声明并不绑定NEAR链。
  • 因此生态有机会扩展到Web2企业。
  • 若能与OpenAI、Anthropic等形成互补或联盟(例如开放Agent标准联盟),AITP生态将迅速壮大。

未来发展前景

构建Agent互联网的有力候选

  • AITP因为直接面向Agent经济活动,前景备受瞩目。
  • 它将通信和交易统一,满足未来代理自主交易、协同的关键需求,这一点使其区别于其他协议。
  • 随着更多业务上由AI代理执行,AITP若被广泛接受,可能成为互联网应用新协议层(类似HTTP之于浏览)。
  • NEAR的支持为其提供了启动加速,但长期胜出还需更中立的参与者加入。
  • 乐观估计,AITP因理念新颖且发布时机好(赶上Agent热潮),会迅速形成开发者社区,在跨Agent交易领域树立标准优势。
  • 一旦示范场景(如自动订票购票的跨Agent流程)成功落地并优于传统爬虫方案,行业会追随采纳。
  • 此外,AITP与MCP/ANP等未必竞争,它注重交互交易层,可与其他Agent底层通讯结合。
  • 因此未来很可能出现协议融合局面:MCP用于工具接入,ANP用于身份和P2P,AITP负责标准交互和支付,各取所长。
  • 总之,AITP具备开创"Agent互联经济"生态的潜力,在未来协议版图中占有一席,尤其在商业场景中可能优势明显

简要说明

综上,各协议各有侧重:

  • MCP 定位于 LLM工具接口,近期落地快且背靠大厂。
  • ANP 致力于 去中心化智能体网络,技术领先但需生态跟进。
  • agents.json 是Web环境的 辅助标准,有望广泛流行并与其它协议配合。
  • LMOS 提供 全栈式平台,适合大规模部署,长期潜力大。
  • AITP 关注 安全交互和经济事务,或引领Agent商业互联。
  • Agora 则代表 未来自适应通信 方向,影响深远。

未来协议格局可能不是单一独占,而是融合互补:

  • 例如用AITP定义交互格式,用ANP解决身份信任,用MCP/agents.json接入具体数据源。

在可见的将来,MCP 因解决痛点直接、生态初具规模,可能在工具集成领域占先;而放眼更长远,具备身份认证和交易能力的开放协议(如ANP、AITP)更符合"Agent互联网"愿景,有望在构建全球智能体网络时发挥更大优势。

本文由mdnice多平台发布

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐