AI智能体协议全景解析：上海交大&ANP社区发布首个系统性综述，构建智能互联的基础设施

未知变量2025-04-302025-04-30

AI 智能体协议全景解析：上海交大 & ANP 社区发布首个系统性综述

一项由上海交通大学杨滢轩、柴化灿、宋源祎、齐思远、温睦宁、李宁、廖俊威、胡浩毅、林江浩、刘卫文、温颖、俞勇、张伟楠，以及 ANP 社区发起人常高伟共同完成的研究，为人工智能智能体领域的互联互通带来了新的曙光。

随着大语言模型（LLM）技术的飞速发展，基于 LLM 的智能体正在客户服务、内容创作，甚至医疗辅助等领域展现出强大的应用潜力。然而，不同智能体系统之间通信标准的碎片化问题，已经成为制约其进一步发展的关键瓶颈。

为了应对这一挑战，上海交通大学的研究团队与 ANP 社区合作，推出了首个全面且系统的 AI 智能体协议综述——《A Survey of AI Agent Protocols》。该综述旨在为解决智能体协议的标准化问题提供清晰的指导框架，推动智能体生态的繁荣发展。

ArXiv 论文链接：https://arxiv.org/abs/2504.16736
Github 仓库地址：https://github.com/zoe-yyx/Awesome-AIAgent-Protocol

交互碎片化：智能体发展的绊脚石

正如早期互联网面临着各种不兼容的通信标准一样，当前的智能体生态系统也深受协议不统一的困扰。研究团队指出，随着应用场景的不断扩展，以及来自不同供应商、采用不同架构的智能体大量涌现，智能体与外部世界交互的规则变得越来越复杂。

这种协议标准化缺失的问题主要体现在以下两个方面：

互操作性受限：阻碍了智能体与外部工具和数据源之间的有效协作。
可扩展性不足：限制了来自不同供应商或架构背景的智能体之间的无缝协作，进而限制了智能体网络的可扩展性。

以上这些问题最终会制约智能体解决复杂实际问题的能力。一个统一、标准的智能体协议对于充分释放人工智能的潜力至关重要。

首创二维分类框架：理清智能体协议脉络

为了更好地理解和管理繁多的智能体协议，论文创新性地提出了一个二维分类体系：

对象导向维度：根据协议关注的交互对象进行区分：
- 上下文导向协议：侧重于智能体与外部工具或数据源的通信，例如 Anthropic 的 MCP 协议。这些协议通常用于连接智能体与外部知识库、API 或其他服务。
- 智能体间协议：专注于多个智能体之间的通信与协作，例如 ANP、A2A 协议。这类协议旨在实现智能体之间的协调、知识共享和任务分配。
应用场景维度：根据协议的应用领域进行划分：
- 通用目的协议：适用于广泛场景的通用协议，具有较高的灵活性和适应性。
- 领域特定协议：针对特定场景优化的专用协议，通常在性能、效率或安全性方面进行了定制优化。例如，LOKA 协议专门用于人机交互，而 CrowdES 协议则专注于机器人智能体之间的交互。

该分类方法涵盖了包括 Anthropic 的 MCP、Google 的 A2A、ANP 社区的 ANP、NEAR 基金会的 AITP 以及 Eclipse 基金会的 LMOS 等十余种主流协议。论文还通过详细的表格，对每种协议的提出者、应用场景、关键技术和开发阶段进行了全面的梳理，为开发者选择合适的协议提供了清晰的指南。这意味着开发者可以根据自身的需求，快速找到最适合的协议，从而加速智能体应用的开发和部署。

七大维度评估：协议性能全面对比

研究团队从以下七个关键维度对各类协议进行了全面评估：

效率：评估延迟、吞吐量和资源利用率，特别是大语言模型智能体特有的 token 消耗成本。
可扩展性：衡量节点扩展性、链接扩展性和能力协商机制，并提出了“能力协商得分”(CNS) 评估指标。
安全性：分析认证模式多样性、角色/访问控制粒度和上下文脱敏机制。
可靠性：检验包重传、流量控制和持久连接机制，并引入了“自动重试计数”(ARC) 等评估指标。
可扩展性：评估向后兼容性、灵活适应性和定制扩展能力。
可操作性：测量协议栈代码量、部署配置复杂度和可观测性。
互操作性：分析跨系统、跨浏览器、跨网络和跨平台适应性。

论文特别强调，理想的智能体协议应在低延迟通信、资源消耗和任务完成速度之间取得平衡，同时适应多智能体系统的复杂性。研究还通过 MCP 从 v1.0 到 v1.2 的迭代演进案例，以及从 MCP 到 ANP 再到 A2A 的协议系统演化案例，展示了智能体协议在功能、性能和安全性方面的多维度权衡。这些案例分析为协议的设计和优化提供了宝贵的参考。

真实案例解析：四种协议在旅行规划中的应用对比

为了更直观地展示不同协议架构的差异，论文通过一个“策划北京到纽约的五日旅行”的真实用例进行了对比分析：

MCP（单一智能体调用工具）：采用集中式架构，单一的 MCP Travel Client 通过 Client-Server 结构依次调用 Flight Server、Hotel Server 和 Weather Server 等工具。所有通信都必须经过中央智能体。
A2A（多智能体复杂协作）：采用分布式架构，将智能分散到多个专业智能体，例如 Flight Agent、Hotel Agent 和 Weather Agent。智能体之间可以直接通信，A2A Travel Planner 作为一个非中心协调器，主要负责收集最终结果。
ANP（跨域智能体通信）：采用跨域架构，通过标准化的跨域交互促进独立智能体之间的协作。明确划分航空公司、酒店和天气网站等不同组织边界，实现基于协议的跨域请求和响应。
Agora（自然语言到协议生成）：采用用户中心架构，将自然语言请求直接转换为标准化协议。引入三阶段处理过程（自然语言理解、协议生成、协议分发），使专业智能体专注于核心能力。

通过这个案例分析，开发者可以根据实际需求（例如智能体的自主性、通信的灵活性、接口的标准化程度以及任务的复杂程度）选择最合适的协议方案。

未来展望：构建智能互联的基础设施

论文对智能体协议的未来发展趋势进行了展望，提出了短期、中期和长期愿景：

短期展望：从静态到可进化

评估与基准测试：开发统一的评估框架，超越任务成功率，纳入通信效率、环境变化适应性等方面。
隐私保护协议：探索允许智能体交换信息，同时最小化内部状态或个人数据暴露的协议。
智能体网格协议：开发受人类群聊启发的通信模型，实现智能体组内通信透明度和共享访问。
可进化协议：将协议视为智能体自适应能力的动态、模块化和可学习组件。

中期展望：从规则到生态系统

内置协议知识：通过训练将协议内容和结构集成到大语言模型参数中，实现无需明确提示的协议兼容行为。
分层协议架构：借鉴经典网络协议设计，将低级传输和同步机制与高级语义和任务相关交互分离，改善异构智能体间的模块化和可扩展性。

长期展望：从协议到智能基础设施

集体智能与扩展定律：探索大规模、互联智能体群体中集体智能的涌现，研究智能体数量、通信拓扑和协议配置如何共同塑造系统级行为。
智能体数据网络：构建专用于自主智能体通信和协调的基础数据基础设施，支持结构化、意图驱动和符合协议的智能体间信息交换。

这项研究不仅系统地梳理了当前 AI 智能体协议的发展现状，更重要的是，它为未来构建互联互通的智能体网络提供了理论基础和技术路线图。正如 TCP/IP 和 HTTP 协议的标准化推动了全球信息革命一样，统一的 AI 智能体协议有望催生一个全新的智能协作时代，实现不同形式的智能在系统间自由流动，工具与智能体无缝交互，最终形成超越单个组件能力的集体智能。