Collaboration IN Multi Agent Systems
多智能体系统协作:一份真正可落地的实践指南
一篇面向生产环境的多智能体协作指南:共享上下文、范围化权限、并发写入、provenance、rollback,以及何时该引入像 Mut 这样的上下文变更层。
Lin Ivan2026年4月17日
很多团队第一次接触 agentic AI 架构时,会本能地去找“到底是哪一个技术让系统变成了 agentic”。这其实是个误导性的提问方式。
一个真正稳定的系统,通常是多层一起配合的结果:
MCP 所处的位置,就是 tool 与 context access 这一层。正因为它不是“包打天下”的东西,所以它的边界反而更清晰。
大多数多智能体系统,并不是因为少了一个更聪明的 prompt 才出问题,而是因为某些接口根本没有被定义清楚。
| 稳定性问题 | 典型表现 |
|---|---|
| Capability ambiguity | 智能体并不清楚该用哪个工具、哪个工具是安全的 |
| Payload sprawl | handoff 里塞了太多原始上下文,却没有足够结构 |
| Role confusion | planner 不小心开始像 executor 一样行动 |
| Approval blur | 高风险动作依赖 prompt 文案而不是 runtime policy |
| Inconsistent interfaces | 不同工具暴露出来的契约不一致,导致 orchestration 很脆 |
user goal
-> planner agent
-> workflow state / task graph
-> worker agents
-> MCP client layer
-> MCP servers / governed context / external systems
-> reviewer or approval layer
-> final action or response
每一层回答的是不同的问题:
MCP 并没有标准化一切,但它确实把三件事变得更稳定了。
Planner 或 coordinator 可以更容易知道当前到底有哪些能力可用,而不是为每个 server 维护一堆不同 wrapper。
Worker 不需要面对每个集成面都不一样的调用习惯。
Resources、prompts、tools 不必被硬塞进一个模糊的大抽象里。这样 orchestration logic 会更容易读,也更容易约束。
如果你想先补整体协议视角,最接近的是 Ultimate Guide to Model Context Protocol (MCP)。如果你想看更贴近 runtime 集成的一面,可以接着看 AI SDK + MCP: A Practical Integration Guide。
看看 puppyone 如何用共享上下文和更窄的 handoff 让智能体团队更稳定Get startedMCP 负责把边界整理清楚,但它不会替你决定:
这些依然是 orchestration 与 governance 的职责。
对很多团队来说,下面这种模式最容易落地:
planner -> asks for policy lookup and case data
worker A -> retrieves policy through MCP-exposed context server
worker B -> retrieves account state through MCP-exposed business server
reviewer -> checks that evidence is sufficient
executor -> performs approved action
如果底层上下文本身就是过期的、冲突的、过宽的,那么再标准的协议也只是在更稳定地传递坏结果。
所以真正耐用的系统通常会同时具备:
这也是为什么,即使引入了 MCP,Agentic Workflow Design 和 AI Pipeline Workflow 这两篇文章依然值得一起看。
当 planner、worker、reviewer 都需要共享同一份 governed context,却又不想每次重搭 delivery logic 时,puppyone 就很适合放在这一层。
不一定。有些团队会把 MCP 集中在 coordinator 或 runtime layer,再给 worker 暴露更窄的一层抽象。
不能。MCP 是协议层。task graph、state、retry、approval 这些依然属于编排层要解决的问题。
两者都重要,但从长期效果看,更清晰的接口往往更能持续积累稳定性。