AI智能体协议全景解析:上海交大&ANP社区发布首个系统性综述,构建智能互联的基础设施
AI智能体协议全景解析:上海交大&ANP社区发布首个系统性综述,构建智能互联的基础设施
未知变量AI 智能体协议全景解析:上海交大 & ANP 社区发布首个系统性综述
一项由上海交通大学杨滢轩、柴化灿、宋源祎、齐思远、温睦宁、李宁、廖俊威、胡浩毅、林江浩、刘卫文、温颖、俞勇、张伟楠,以及 ANP 社区发起人常高伟共同完成的研究,为人工智能智能体领域的互联互通带来了新的曙光。
随着大语言模型(LLM)技术的飞速发展,基于 LLM 的智能体正在客户服务、内容创作,甚至医疗辅助等领域展现出强大的应用潜力。然而,不同智能体系统之间通信标准的碎片化问题,已经成为制约其进一步发展的关键瓶颈。
为了应对这一挑战,上海交通大学的研究团队与 ANP 社区合作,推出了首个全面且系统的 AI 智能体协议综述——《A Survey of AI Agent Protocols》。该综述旨在为解决智能体协议的标准化问题提供清晰的指导框架,推动智能体生态的繁荣发展。
- ArXiv 论文链接:https://arxiv.org/abs/2504.16736
- Github 仓库地址:https://github.com/zoe-yyx/Awesome-AIAgent-Protocol
交互碎片化:智能体发展的绊脚石
正如早期互联网面临着各种不兼容的通信标准一样,当前的智能体生态系统也深受协议不统一的困扰。研究团队指出,随着应用场景的不断扩展,以及来自不同供应商、采用不同架构的智能体大量涌现,智能体与外部世界交互的规则变得越来越复杂。
这种协议标准化缺失的问题主要体现在以下两个方面:
- 互操作性受限:阻碍了智能体与外部工具和数据源之间的有效协作。
- 可扩展性不足:限制了来自不同供应商或架构背景的智能体之间的无缝协作,进而限制了智能体网络的可扩展性。
以上这些问题最终会制约智能体解决复杂实际问题的能力。一个统一、标准的智能体协议对于充分释放人工智能的潜力至关重要。
首创二维分类框架:理清智能体协议脉络
为了更好地理解和管理繁多的智能体协议,论文创新性地提出了一个二维分类体系:
对象导向维度:根据协议关注的交互对象进行区分:
- 上下文导向协议:侧重于智能体与外部工具或数据源的通信,例如 Anthropic 的 MCP 协议。这些协议通常用于连接智能体与外部知识库、API 或其他服务。
- 智能体间协议:专注于多个智能体之间的通信与协作,例如 ANP、A2A 协议。这类协议旨在实现智能体之间的协调、知识共享和任务分配。
应用场景维度:根据协议的应用领域进行划分:
- 通用目的协议:适用于广泛场景的通用协议,具有较高的灵活性和适应性。
- 领域特定协议:针对特定场景优化的专用协议,通常在性能、效率或安全性方面进行了定制优化。例如,LOKA 协议专门用于人机交互,而 CrowdES 协议则专注于机器人智能体之间的交互。
该分类方法涵盖了包括 Anthropic 的 MCP、Google 的 A2A、ANP 社区的 ANP、NEAR 基金会的 AITP 以及 Eclipse 基金会的 LMOS 等十余种主流协议。论文还通过详细的表格,对每种协议的提出者、应用场景、关键技术和开发阶段进行了全面的梳理,为开发者选择合适的协议提供了清晰的指南。这意味着开发者可以根据自身的需求,快速找到最适合的协议,从而加速智能体应用的开发和部署。
七大维度评估:协议性能全面对比
研究团队从以下七个关键维度对各类协议进行了全面评估:
- 效率:评估延迟、吞吐量和资源利用率,特别是大语言模型智能体特有的 token 消耗成本。
- 可扩展性:衡量节点扩展性、链接扩展性和能力协商机制,并提出了“能力协商得分”(CNS) 评估指标。
- 安全性:分析认证模式多样性、角色/访问控制粒度和上下文脱敏机制。
- 可靠性:检验包重传、流量控制和持久连接机制,并引入了“自动重试计数”(ARC) 等评估指标。
- 可扩展性:评估向后兼容性、灵活适应性和定制扩展能力。
- 可操作性:测量协议栈代码量、部署配置复杂度和可观测性。
- 互操作性:分析跨系统、跨浏览器、跨网络和跨平台适应性。
论文特别强调,理想的智能体协议应在低延迟通信、资源消耗和任务完成速度之间取得平衡,同时适应多智能体系统的复杂性。研究还通过 MCP 从 v1.0 到 v1.2 的迭代演进案例,以及从 MCP 到 ANP 再到 A2A 的协议系统演化案例,展示了智能体协议在功能、性能和安全性方面的多维度权衡。这些案例分析为协议的设计和优化提供了宝贵的参考。
真实案例解析:四种协议在旅行规划中的应用对比
为了更直观地展示不同协议架构的差异,论文通过一个“策划北京到纽约的五日旅行”的真实用例进行了对比分析:
- MCP(单一智能体调用工具):采用集中式架构,单一的 MCP Travel Client 通过 Client-Server 结构依次调用 Flight Server、Hotel Server 和 Weather Server 等工具。所有通信都必须经过中央智能体。
- A2A(多智能体复杂协作):采用分布式架构,将智能分散到多个专业智能体,例如 Flight Agent、Hotel Agent 和 Weather Agent。智能体之间可以直接通信,A2A Travel Planner 作为一个非中心协调器,主要负责收集最终结果。
- ANP(跨域智能体通信):采用跨域架构,通过标准化的跨域交互促进独立智能体之间的协作。明确划分航空公司、酒店和天气网站等不同组织边界,实现基于协议的跨域请求和响应。
- Agora(自然语言到协议生成):采用用户中心架构,将自然语言请求直接转换为标准化协议。引入三阶段处理过程(自然语言理解、协议生成、协议分发),使专业智能体专注于核心能力。
通过这个案例分析,开发者可以根据实际需求(例如智能体的自主性、通信的灵活性、接口的标准化程度以及任务的复杂程度)选择最合适的协议方案。
未来展望:构建智能互联的基础设施
论文对智能体协议的未来发展趋势进行了展望,提出了短期、中期和长期愿景:
短期展望:从静态到可进化
- 评估与基准测试:开发统一的评估框架,超越任务成功率,纳入通信效率、环境变化适应性等方面。
- 隐私保护协议:探索允许智能体交换信息,同时最小化内部状态或个人数据暴露的协议。
- 智能体网格协议:开发受人类群聊启发的通信模型,实现智能体组内通信透明度和共享访问。
- 可进化协议:将协议视为智能体自适应能力的动态、模块化和可学习组件。
中期展望:从规则到生态系统
- 内置协议知识:通过训练将协议内容和结构集成到大语言模型参数中,实现无需明确提示的协议兼容行为。
- 分层协议架构:借鉴经典网络协议设计,将低级传输和同步机制与高级语义和任务相关交互分离,改善异构智能体间的模块化和可扩展性。
长期展望:从协议到智能基础设施
- 集体智能与扩展定律:探索大规模、互联智能体群体中集体智能的涌现,研究智能体数量、通信拓扑和协议配置如何共同塑造系统级行为。
- 智能体数据网络:构建专用于自主智能体通信和协调的基础数据基础设施,支持结构化、意图驱动和符合协议的智能体间信息交换。
这项研究不仅系统地梳理了当前 AI 智能体协议的发展现状,更重要的是,它为未来构建互联互通的智能体网络提供了理论基础和技术路线图。正如 TCP/IP 和 HTTP 协议的标准化推动了全球信息革命一样,统一的 AI 智能体协议有望催生一个全新的智能协作时代,实现不同形式的智能在系统间自由流动,工具与智能体无缝交互,最终形成超越单个组件能力的集体智能。








