Claude Code爆火背后的Agent Harness底层逻辑，UIUC、Meta、斯坦福深度解读

1 个月前

AI资讯

65 阅读

智能体 claude Code Harness [Agent 代码]

代码即中枢：三大顶级机构重新定义Agent Harness

智能体在长期任务中真正串起推理、行动、反馈与协作的操作对象是什么？UIUC、Meta与斯坦福的联合综述给出了一个反常识的答案：不是自然语言，而是代码。这里“代码”不是指框架源码，而是智能体在执行过程中不断生成、运行、修改、保存和共享的中间产物——比如Claude Code产出的PLAN.md、Skills.md，或者用于验证的Python脚本。研究团队将这套外围工程体系称为智能体脚手架（Agent Harness），并基于代码的三大天然特质——可检查性（执行产生堆栈、日志、报错）、状态化（文件系统、数据库可持久化任务进度）以及可执行性（代码能被解释器精确运行）——构建了一个三层架构：脚手架接口层（代码承载推理、行动和环境建模）、脚手架机制层（规划、记忆、工具、控制与优化）以及多智能体扩展层（角色专业化与共享代码基底）。这一框架首次将代码从“产物”提升为智能体的“神经与肌肉”，奠定了整个Harness工程的理论基石。

七层工程：Claude Code生产级源码的纵深防御

对Claude Code源码的逆向工程揭示，这款备受好评的工具绝非简单的“命令行ChatGPT”，而是一个七层工程系统。从底层技术栈到上层编排，它构建了超过40个专用工具（Read、Edit、Write、Bash等），每个工具都附带独立提示词、权限校验和缓存策略。尤其在工具执行编排层，系统支持真正的并行调用——当模型同时请求git status和git diff时，Claude Code会并发发出两个工具调用而非串行等待。安全架构更是形成纵深防御：YOLO分类器让AI审核AI，搭配细粒度的权限系统，确保高危操作必须经过人类审批。多Agent编排则实现了三种模式——审查与修复、推理辩论、以及Agent委托指引（精确描述“不要偷看，不要竞争”约束）。该团队还引入了智能缓存设计，利用Anthropic API的前缀匹配机制，实现90%的成本削减和延迟降低。整个系统的工程哲学在于：控制行为的最佳方式不是更多代码，而是更好的约束——系统提示词被当作控制面，用“工具调用间文字不超过25词”这样的数值锚定来精确引导模型行为。

Claude Code爆火背后的Agent Harness底层逻辑，UIUC、Meta、斯坦福深度解读

从手工到自动：Meta-Harness让AI自己优化脚手架

斯坦福与MIT团队提出的Meta-Harness，被业界称为“反智”的暴力方案：让一个足够强的coding Agent自己一轮轮优化Harness，过程中不压缩任何历史信息。每一轮迭代产生的候选Harness源码、逐样本执行轨迹、评分结果全部以文件形式保存在结构化目录中——没有数据库、没有向量检索，只有最朴素的文件和文件夹。外层循环极其简洁：生成候选 → 评估 → 保存完整结果 → Agent分析所有历史 → 生成新候选 → 重复。每轮评估能产生高达1000万tokens的诊断信息。Agent并非被喂摘要，而是自主决定阅读哪些文件（中位数每轮读取82个文件），对比最优与最差方案的差异，推断设计决策导致性能变化的原因。在SWE-Bench评测集上，Meta-Harness在Claude Haiku 4.5组别以37.6%位居第一，在Claude Opus 4.6组别以76.4%位居第二，甚至超越了Anthropic官方手工设计的Harness。更令人震撼的是，系统自主发现了关键优化“环境自举”（Environment Bootstrapping）：在Agent执行任务前自动运行shell命令收集沙箱环境快照，注入初始prompt，直接消除了2-4轮环境探索的token浪费——这一优化没有任何人类工程师事先指定。

争论终结：Harness不是拐杖，而是可进化的控制面

行业曾围绕Harness陷入激烈争论：OpenAI的Noam Brown称Harness是“拐杖”，模型终将超越它；Anthropic的实践则展示了“Build to Delete”——随着模型从Opus 4.5升级到4.6，Harness自动变薄，成本从6小时200美元降至3.8小时125美元。Meta-Harness的出现重新定义了坐标系：它用Bitter Lesson的逻辑解决了Bitter Lesson的争议——手工设计Harness终将被淘汰，但Harness本身不会消失，只是改由AI用通用搜索自己找到最优解。当Harness优化被自动化后，Model与Harness不再是非此即彼：模型变强，Meta-Harness搜出的最优Harness会自动变薄（即自动执行Build to Delete）。论文实验进一步证实：完整轨迹带来的收益远高于摘要压缩——在SWE-Bench上，使用完整轨迹的Meta-Harness得分50.0%，而将轨迹压缩为摘要后仅得35.0%，15个百分点的差距直接证明“人为预处理和压缩不是帮忙，是在添乱”。核心结论是：Harness的厚度取决于模型当前的能力边界，且必须随模型迭代、任务变化而持续演化——这正是静态手工设计无法解决的问题。

未来战场：训练态Harness与模型协同进化

论文团队在结尾提出了更深远的方向：Harness与模型权重的协同进化。今天模型训练和框架设计仍是两个独立过程，但如果Harness能被自动优化，未来的模型训练如何将其纳入优化循环？前阿里Qwen技术负责人林俊旸在离职长文中也呼应了这一观点：Harness不只是推理时的运行框架，更应成为训练时的核心基础设施——Agent在什么样的Harness环境里训练，决定了它能学到什么。推理时的Harness目标明确、跑分见高下，AI比人快；但训练时的Harness定义的是模型整体能力的长期增长，这是一个长程、稀疏、很难归因的过程。这一层的搭建，恐怕还得由人类掌控。从短期看，Meta-Harness已实现了“手工Harness时代的终结”；从长期看，Harness工程正从“约束模型行为”进化为“训练模型能力”的关键杠杆，而代码作为可执行、可检查、状态化的媒介，将始终是AI智能体从演示级玩具蜕变为工业级生产力的核心基建。

Claude Code爆火背后的Agent Harness底层逻辑，UIUC、Meta、斯坦福深度解读

代码即中枢：三大顶级机构重新定义Agent Harness

七层工程：Claude Code生产级源码的纵深防御

从手工到自动：Meta-Harness让AI自己优化脚手架

争论终结：Harness不是拐杖，而是可进化的控制面

未来战场：训练态Harness与模型协同进化

链接失效反馈