9天Claude Code重写100万行代码、6755次提交,Bun完成史上最大AI重构后,开发者质疑:99.8%测试通过率,真的代表安全?
9天6755次提交,Claude Code完成百万行Rust迁移
2026年5月14日,一条合并进Bun主分支的PR震惊开发者社区:超过100万行由Claude Code智能体生成的Rust代码,在短短9天内完成,共计6755次提交。Bun的新东家Anthropic去年12月收购了这个拥有每月超700万下载量、GitHub 9.2万星的JavaScript运行时,并将这场AI重构视为验证其AI编程能力的最大试验田。Bun团队宣称,新版本通过了现有测试套件99.8%的测试,并彻底抛弃了多年来基于Zig语言的实现。这一成就迅速登上Hacker News热榜,被认为标志着AI编程进入新阶段。

99.8%测试通过率下的隐忧:超1万个unsafe引用
然而,当开发者深入审视代码时,一个令人不安的数字浮出水面:超过1万个unsafe Rust引用。Bun团队发布的迁移指南明确要求Agent尽可能“忠实地移植”Zig代码——保持相同的架构、相同的数据结构,逐文件进行转换。这意味着AI并非在重写Rust的惯用代码,而是将Zig的底层逻辑机械地翻译成Rust,大量依赖unsafe块来绕过Rust的类型系统。CSDN的报道指出,99.8%的测试通过率与超1万个unsafe引用之间并不矛盾,它们本质上描述的是同一件事:AI在严格约束下完成了功能复制,但安全边界被大幅后撤。
真正的风险在unsafe代码里:亚马逊都验证不完的难题
开发者dreamreal在长篇分析《Bun Has Been Converted to Rust. Now What?》中尖锐指出:“验证Rust中一段unsafe代码是否真正安全,本身就是一件极其困难的事情。”困难到什么程度?Amazon曾联合Rust基金会发起社区项目,专门验证Rust标准库中的unsafe代码——这部分代码规模远比Bun的数百万行运行时代码小得多,且由人工精心编写、经过严格审查。即便如此,该项目仍在持续进行。因为只要某个unsafe块中存在一个错误,就可能让周围所有依赖Rust类型系统保护的代码彻底失效。正如Todd Smith所警告的:unsafe代码重新打开了通往未定义行为的大门。
Hacker News上最激烈的争论:不是Rust vs Zig,而是AI的“忠实”是否等于安全
在Hacker News的讨论中,最激烈的问题并非“Bun该用Rust还是Zig”,也非“AI是否应该编写运行时系统”。核心争议在于:当AI被指令“忠实移植”旧代码时,它产生的99.8%测试通过率,究竟意味着安全,还是意味着一个难以察觉的bug火山?Bun团队回应称这是早期Canary渠道版本,后续PR会逐步将代码重构成符合Rust惯用写法的形式,unsafe数量自然会下降。但开发者质疑:在AI已经生成百万行unsafe代码的基础上,靠人类再逐行审查重构,其成本可能远超人工重写。这场实验的代价,也许才刚刚开始被计算。