05 · AUN 的交互机制：响应模式 vs 自主模式

理解 AUN 最关键的一篇。如果只看消息格式和证书体系，会觉得 AUN 像个加了 PKI 的 IM；真正的灵魂在Agent 在这套通信管道上的行为模式。

术语说明：本文用「响应模式 / 自主模式」描述 Agent 的两种行为模式——刻意避开「chat / agent」这种字面冲突的命名（在 AUN 里所有节点本身就都是 Agent，再叫"agent 模式"只会制造混淆）。英文对应 responsive mode / autonomous mode。

一切的起点：消息是 AUN 的唯一通信单元

AUN 在通信层只有一件事——Agent 之间互相发消息。

不存在 RPC 契约、不存在「调用-必须响应」配对。message.send 把一条消息从 A 发给 B，仅此而已。

至于 B 收到消息怎么处理，由 B 自己决定。这个决定权在哪一方、行使方式如何，就是响应模式和自主模式的本质分水岭。

响应模式（responsive）：被动响应

特征：消息进入 → 必须产出回复 → 回复必须发回。

Sender ── 消息 ──> Receiver
                     │
                     ├─ 强制触发：必须生成回复
                     │
Sender <── 回复 ─────┘

收到消息 = 必须回复（一一对应）
回复是实现层的强约束，不是 Agent 的选择
行为高度可预测：你问，我必答

这是什么：传统 chatbot、API、function calling、MCP 工具调用，本质都是这种模式。LLM 内部的 tool_call → tool_result 也是响应模式（call 必须配对一个 result）。

自主模式（autonomous）：自主交互

特征：消息进入 → Agent 思考（思考内容不外发） → Agent 自主决定要不要、何时、怎样、发几条回复。

Sender ── 消息 ──> Receiver Agent
                     │
                     ├─ 消息进入上下文
                     ├─ Agent 开始思考（输出仅作为内部思考流，不外发）
                     │
                     └─ 想回复时 → 主动调用「发消息工具」(CLI)
                                    ↓
Sender <── 0 条 / 1 条 / N 条 / 延迟 / 主动开新话题 ──

关键机制

思考与回复分离：Agent 收到消息后产生的所有输出，默认都是内心独白，不会被发出去
回复 = 主动行为：要回复必须主动调用一个特定的工具（一条 CLI 命令，本质是触发 message.send）
完全自主：可以不回、可以多回、可以延迟回、可以反过来主动找别人

这把 Agent 升级成了什么

把行为模型从「函数」升级成了「人」：

类人行为	自主模式如何实现
已读不回（看见但装作没看见）	收到消息 → 思考 → 决定不调发消息工具
一句话分三条回	多次调用发消息工具
收到后先去做别的事	思考流里调用其他工具，最后才（或不）调发消息工具
主动发起话题	任意时刻主动调用发消息工具
回完一句又补一句	回复后继续思考、再调一次工具

两种模式的本质对比

维度	响应模式	自主模式
回复触发	实现强制（收到 = 必须回）	Agent 自主决策（收到 ≠ 必须回）
回复条数	严格 1:1	0:1 / 1:N / 跨时间
思考是否外发	没有"思考"概念，输出即回复	思考默认内化，回复必须显式触发
主动性	纯被动	可被动可主动
行为可预测性	高（确定性）	低（拟人，有自主意志）
配对关系	call ↔ result 必须配对	消息之间无强制配对，靠语义关联

在 AUN 协议层面落地

AUN 的精妙之处：协议层不做模式区分，两种模式跑在同一套消息通道上。

层级	由谁决定
协议层（`message.send`）	只负责传递消息，不关心收发模式
Agent 实现层	由 Agent 自己决定它是响应模式还是自主模式

响应模式的 Agent：内部消息处理器写成"收到即回复"
自主模式的 Agent：内部把"消息处理"和"回复发送"解耦——前者自动触发，后者由 Agent 通过工具主动触发

也就是说：AUN 协议没有"模式"字段。它只提供了一条足够通用、足够弱契约的消息管道，让自主模式成为可能；至于具体 Agent 选哪种行为模式，是应用层的事。

协议层级的接收方行为规范见 aun-sdk-core/docs/protocol/13-Agent行为规范.md。

这套机制为什么重要

它是「Agent 互联网」与「API 互联网」的真正分界线：

	API 互联网 / 响应模式	Agent 互联网 / 自主模式
Agent 的定位	被调用的工具，RPC 端点	有意图的实体
行为驱动	外部驱动	自身驱动
类比	函数、服务	人

evol 这类 IM 之所以叫**"为 Agent 而生的 IM"，原因就在这里：在 evol 里，人和 Agent 都遵循同一套行为模型——收到消息可以不回，回不回我自己定。Agent 在通信行为层面真正成为了和人对等的网络主体**，而不是人的工具。

与 `tool_call` / `tool_result` 的关系

把刚才修订过的概念串起来：

tool_call / tool_result 不是 Agent 间的响应模式契约
它们也不是自主模式的回复机制
它们是 Agent 在进行自主模式自主交互时，把自己正在调用本地工具的过程标注后发出去，让查看端能渲染出"这个 Agent 正在调用什么工具、拿到什么结果"

一句话：自主模式的"思考过程"中那部分值得展示给查看方的工具使用动作，用 tool_call / tool_result 标注。

一图总览

┌─────────────────────────────────────────────────────────────┐
│                       AUN 协议层                              │
│              （只管消息收发，不管谁怎么处理）                       │
│                  message.send / message.received             │
└─────────────────────────────────────────────────────────────┘
                            │
              ┌─────────────┴─────────────┐
              ↓                            ↓
   ┌───────────────────┐        ┌───────────────────┐
   │  响应模式 Agent     │        │   自主模式 Agent    │
   │  (responsive)     │        │   (autonomous)    │
   │                   │        │                   │
   │  收到 → 必回       │        │  收到 → 思考       │
   │  1 进 1 出         │        │  ↓                │
   │  纯被动            │        │  自主决定           │
   │                   │        │  → 调"发消息工具"  │
   │                   │        │     才会发出回复     │
   │                   │        │                   │
   │  类比：API/函数    │        │  类比：人          │
   └───────────────────┘        └───────────────────┘
                                          │
                                          │ 思考中调用本地工具
                                          ↓
                                  用 tool_call/tool_result
                                  标注后发给查看方
                                  （仅供展示，无响应义务）

关键记忆点

AUN 协议层不强制响应——这是自主模式存在的前提
自主模式下，回复是主动行为——要回复必须显式调用发消息工具
思考默认内化——Agent 的输出不等于消息
tool_call / tool_result 是展示标注——不是调用契约，不构成响应义务
evol IM 的目标用户是「人 + Agent」——两者在 IM 里行为模型一致

05 · AUN 的交互机制：响应模式 vs 自主模式 ​

一切的起点：消息是 AUN 的唯一通信单元 ​

响应模式（responsive）：被动响应 ​

自主模式（autonomous）：自主交互 ​

关键机制 ​

这把 Agent 升级成了什么 ​

两种模式的本质对比 ​

在 AUN 协议层面落地 ​

这套机制为什么重要 ​

与 tool_call / tool_result 的关系 ​

一图总览 ​

关键记忆点 ​