Multi-Agent 火了,但 AI 的组织病还没人治

工程噩梦:锁机制让20个Agent沦为1个

当多个Agent并行处理同一代码库或共享资源时,最常见的协作方案是加锁。但实践证明,Agent会持有锁太久、忘记释放、甚至在无需加锁的地方盲目上锁。即便锁机制勉强正常运作,它也迅速成为系统瓶颈。Cursor团队在官方文档中承认,20个Agent同时工作时,吞吐量骤降至仅相当于1到3个Agent的表现,大部分时间耗在等待锁。为此,他们被迫将架构改为“根规划器-子规划器-工作者”的层级结构:规划器负责全局拆解任务,工作者只完成局部任务,彼此不横向通信,完成后写交接报告向上汇报。这种设计本质上是用人类组织学中的“命令链”来规避Agent之间的直接资源冲突。

旁观者效应蔓延:群体中每个Agent都不愿担责

研究发现,多Agent系统中的责任稀释现象十分严重。Dahlia Shehata和Ming Li在2026年的论文《The Bystander Effect in Multi-Agent Reasoning》中量化了“认知偷懒”——当Agent数量增加时,单个Agent主动发现错误、提出批评的意愿显著下降,就像人类群体中旁观者越多,出手相助的概率越低。早期人们乐观地认为多个模型互相辩论可以抵消幻觉和偏差,但现在证据显示,多一个Agent可能不是多一份纠正责任,而是多一份推诿空间。一个Agent会想:“其他Agent都没反对,说明计划没问题”,从而放弃自己的判断。

Multi-Agent 火了,但 AI 的组织病还没人治

行为不可预测:孤立的智能体一进团队就变“色”

Sinem Erisken等人提交的论文《MAEBE: Multi-Agent Emergent Behavior Framework》揭示了一个更令人不安的现象:一个LLM在单独回答时表现出的偏好和倾向,完全无法可靠预测它被放入多智能体群体后的行为。一个在单任务中谨慎保守的Agent,在群体中可能变得激进冒险;一个在独立测试中逻辑严密的模型,合作时却可能附和错误共识。Yuxuan Li等人的测试还发现,当每个Agent持有部分分散信息时,群体容易围绕一个错误结论越走越远——因为没有人拥有完整信息来发起有效反驳,而共识压力又让偏差自我强化。

现有Harness是“消防队”,不是“建筑师”

今天市面上最成功的Multi-Agent框架(harness)主要解决的是外部组织与信息流问题:如何编排任务、如何传递上下文、如何回收结果。它们几乎都不关心也无能力干预Agent内部的心理过程,例如规划器的语气是否影响了工作者的判断,或者评审者是否因为主线方案已成定局而放弃反对意见。学界的深度研究——从认知责任稀释到群体偏见放大——在2025至2026年被揭示出来,但工程界大多选择绕开:通过限制Agent间通信、强制层级结构、人为降低交互自由度来强行稳定系统。这种方案虽然有效,却从根本上回避了问题:我们并未真正理解如何让一群AI健康协作,只是给它们戴上了太多镣铐。

出路在协同训练,而非单兵测试

Llama三轮崩盘已经是一个鲜明反例:单Agent能完美完成的任务,在Multi-Agent环境下模型未必能复现。这说明模型的能力不能脱离部署环境来评价。未来的方向被指向“Multi-Agent Co-Training”——多Agent协同训练。模型必须在它将来实际运行的多智能体环境中进行训练和微调,让它们学会如何应对群体中的偏见、如何主动打破共识、如何在信息不完整时承担认知责任。单Agent的跑分只是入场券,不能当作“通行证”。唯有让训练环境与推理环境对齐,才可能真正治愈AI的组织病。