Agentic AI 里的 MCP:协议层如何让多智能体工作流更稳定

2026年4月2日Lin Ivan

核心要点

  • 在 agentic AI 里,MCP 更适合被理解成 runtime 和外部能力之间的一层协议,而不是整个编排系统本身。
  • 多智能体工作流之所以不稳定,常常不是因为 prompt 不够聪明,而是因为工具边界、上下文载荷和审批规则都不够清晰。
  • 协议层真正稳定的是 capability discovery、invocation shape 和 handoff consistency。
  • MCP 不会替代 planning、memory、scheduling 或 governance,它只是让这些层之间的接口更清楚。
  • 当多个智能体需要通过稳定的 delivery path 共享同一份 governed context 时,puppyone 会特别有价值。

MCP 是一层,不是整个栈

很多团队第一次接触 agentic AI 架构时,会本能地去找“到底是哪一个技术让系统变成了 agentic”。这其实是个误导性的提问方式。

一个真正稳定的系统,通常是多层一起配合的结果:

  • planning
  • state management
  • tool access
  • context delivery
  • approvals
  • logging 与 rollback

MCP 所处的位置,就是 tool 与 context access 这一层。正因为它不是“包打天下”的东西,所以它的边界反而更清晰。

为什么多智能体工作流会变得不稳定

大多数多智能体系统,并不是因为少了一个更聪明的 prompt 才出问题,而是因为某些接口根本没有被定义清楚。

稳定性问题典型表现
Capability ambiguity智能体并不清楚该用哪个工具、哪个工具是安全的
Payload sprawlhandoff 里塞了太多原始上下文,却没有足够结构
Role confusionplanner 不小心开始像 executor 一样行动
Approval blur高风险动作依赖 prompt 文案而不是 runtime policy
Inconsistent interfaces不同工具暴露出来的契约不一致,导致 orchestration 很脆

一个简单的参考架构

user goal
  -> planner agent
  -> workflow state / task graph
  -> worker agents
  -> MCP client layer
  -> MCP servers / governed context / external systems
  -> reviewer or approval layer
  -> final action or response

每一层回答的是不同的问题:

  • planner:下一步该做什么
  • state graph:已经发生了什么
  • MCP layer:有哪些能力、这些能力怎么调用
  • reviewer:当前动作是否足够安全、足够完整

协议层真正稳定了什么

MCP 并没有标准化一切,但它确实把三件事变得更稳定了。

1. Capability discovery

Planner 或 coordinator 可以更容易知道当前到底有哪些能力可用,而不是为每个 server 维护一堆不同 wrapper。

2. Invocation shape

Worker 不需要面对每个集成面都不一样的调用习惯。

3. Surface separation

Resources、prompts、tools 不必被硬塞进一个模糊的大抽象里。这样 orchestration logic 会更容易读,也更容易约束。

如果你想先补整体协议视角,最接近的是 Ultimate Guide to Model Context Protocol (MCP)。如果你想看更贴近 runtime 集成的一面,可以接着看 AI SDK + MCP: A Practical Integration Guide

看看 puppyone 如何用共享上下文和更窄的 handoff 让智能体团队更稳定Get started

MCP 不会替你稳定的部分

MCP 负责把边界整理清楚,但它不会替你决定:

  • 任务该怎么拆
  • memory 该怎么总结
  • state 应该保留多久
  • 什么时候要升级到人工
  • 哪些动作需要 rollback

这些依然是 orchestration 与 governance 的职责。

一个更实用的多智能体模式

对很多团队来说,下面这种模式最容易落地:

  1. 一个拥有较宽读取能力的 planner
  2. 多个只拿到 task-scoped capability 的 worker
  3. 在高风险 write 前加一个 review 或 approval 步骤
  4. 用一个 shared context system 统一打包证据
planner -> asks for policy lookup and case data
worker A -> retrieves policy through MCP-exposed context server
worker B -> retrieves account state through MCP-exposed business server
reviewer -> checks that evidence is sufficient
executor -> performs approved action

为什么上下文质量仍然比协议优雅更重要

如果底层上下文本身就是过期的、冲突的、过宽的,那么再标准的协议也只是在更稳定地传递坏结果。

所以真正耐用的系统通常会同时具备:

  • protocol consistency
  • context shaping
  • role scoping
  • action controls

这也是为什么,即使引入了 MCP,Agentic Workflow DesignAI Pipeline Workflow 这两篇文章依然值得一起看。

puppyone 适合放在哪

当 planner、worker、reviewer 都需要共享同一份 governed context,却又不想每次重搭 delivery logic 时,puppyone 就很适合放在这一层。

  • 用结构化上下文替代反复传递的 raw dump
  • 让 handoff payload 更窄、更稳定
  • 把 single source of truth 暴露在稳定 surface 上
  • 按权限把不同 slice 分发给不同智能体
从 puppyone 开始:给每个智能体正确的 context slice,并让 handoff 可审计Get started

FAQs

Q1:是不是每个智能体都要直接接 MCP?

不一定。有些团队会把 MCP 集中在 coordinator 或 runtime layer,再给 worker 暴露更窄的一层抽象。

Q2:MCP 能替代 orchestration framework 吗?

不能。MCP 是协议层。task graph、state、retry、approval 这些依然属于编排层要解决的问题。

Q3:让多智能体工作流更稳定,靠更好的 prompt 还是更清晰的接口?

两者都重要,但从长期效果看,更清晰的接口往往更能持续积累稳定性。