Prompt已死,Loop Engineering成了硅谷AI圈新顶流

一条推文引爆新范式:你该设计Loop,而不是Prompt

OpenClaw 开发者 Peter Steinberger 的一条推文获得三百万观看:“你不该再 Prompt Agent 了,你该设计 Loop。”Anthropic Claude Code 负责人 Boris Cherny 随即回应:“我不再手动提示 Claude 了。我有 loop 在跑,它们负责提示 Claude、决定下一步做什么。我的工作是写 loop。”Google Cloud AI 总监 Addy Osmani 迅速撰文拆解这一新概念,将其定义为“用你设计的系统替代你自己去 prompt agent”。Loop Engineering 的核心理念是:你只需定义一个递归目标,AI 反复迭代直至完成,整个过程无需人类手把手输入指令。

一个完整Loop的五大核心模块:Skill、Memory、Connector 如何闭环

一个成熟的自循环系统必须包含五个基本模块,Claude Code 和 Codex 均已具备这些能力:

Prompt已死,Loop Engineering成了硅谷AI圈新顶流

  • Skill(技能):每个 loop 以 SKILL.md 文件为入口,里面包含指令和元数据,外加可选的脚本和资源。Codex 通过 $/skills 调用 skill,或在任务描述与 skill 描述匹配时自动触发。Claude Code 的做法完全相同,一个简洁、无聊的描述反而比花哨的描述更好用,因为它更容易被自动匹配。
  • Memory(记忆):治好 Agent 的“金鱼记忆”。loop 系统能记录状态、中间结果、历史决策,让 Agent 在多次迭代中不会遗忘上下文。Claude Code 和 Codex 都支持在文件夹中存储持久化的上下文信息。
  • Connector(连接器):让 loop 摸到真实世界。通过 connector 与外部工具、API、文件系统交互,例如读取 CI 失败日志、打开 Linear 看板、创建 Git worktree。这使 loop 不再只是语言模型的自嗨,而是能真正影响软件工程的物理流程。

Karpathy 的 630 行代码:一个自主研究循环如何实现 11% 加速

今年三月,Andrej Karpathy 用 630 行 Python 让一群 Agent 自己跑了 700 次实验,发现了 20 个优化点,并在更大模型上实现了 11% 的训练加速。他说:“所有前沿实验室都会做这个。”这个例子展示了一个单 metric 的自主研究循环:Agent 被赋予一个明确目标(例如降低圈复杂度或加速训练),然后自动生成假设、执行实验、记录结果、对比目标,如果未达标则继续迭代。Karpathy 的 loop 没有用到任何复杂的 Agent 框架,纯粹用 Python 编排,却证明了“自动化自我驱动”的巨大价值。

Claude Code vs Codex:两大工具如何实现 Loop 自动化

Claude Code 和 Codex 都采用了相同的文件夹结构:一个 .claude/.codex/ 目录,里面包含 skills、agents、subagents 的定义。Codex 只在被要求时生成 subagents,同时运行多个,然后合并结果;用户可以在 .codex/agents/ 下用 TOML 文件定义 agent,每个都有名字、描述、指令和可选的模型参数。Claude Code 则在 .claude/agents/ 中管理 subagents 和 agent teams,任务在它们之间传递。常见的分工是一个 agent 负责探索,一个实现,一个对照规格验证。

更生动的场景是:每天早上一个 automation 在仓库上跑起来,其提示词调用一个 triage skill,读取昨天的 CI 失败、open issues、最近的 commits,然后把发现写进 Markdown 文件或 Linear 看板。对于每一个值得处理的发现,loop 会开一个隔离的 worktree,派一个 sub-agent 起草修复方案,再派第二个 sub-agent 对照项目 skills 和现有测试来审查这份草案——整个过程无需人工干预。

工程师新角色:写 Loop 的四大原则与一个警告

Boris Cherny 总结自己的新工作:“我的工作是写 loop。” 这意味着工程师的角色从“对话式 Prompt 匠人”转变为“循环系统架构师”。但这一转变并非无门槛;以下是实操中必须记住的原则:

  • Goal 越具体越好:不要写“提升代码质量”,而要写“将圈复杂度大于15的函数数量减少至0”。模糊的目标会让 loop 陷入无休止的迭代。
  • Loop 放大错误,也放大正确:如果你手动跑都跑不通某个流程,自动化之后就是自动化地出错。必须先确保单次执行的质量。
  • 从 Harness 自然生长:Loop Engineering 并不凭空出现,它是在 Harness Engineering(为单个 agent 构建运行环境)之上的范式升级。先让你的 agent 在 harness 里稳定工作,再考虑给它加 loop。
  • Token 预算要烧得起:Loop 让 Agent 自行决定何时运行、运行多少次,token 消耗会指数级上升。必须设计好“终止条件”和“成本上限”,否则一张账单就能惊醒梦中人。

一个来自开发者社区的警告:“如果你手动跑都跑不通,自动化之后就是自动化地出错。” Loop 不是万能药,它是建立在可靠基础组件之上的进阶玩法。当硅谷高呼“Prompt 已死”时,真正的工程师正在埋头写 Loop,让 Agent 自己 Prompt Agent。