有点伤自尊，但太值了，Karpathy：当AI接管80%代码，我看清了AGI魔法

3 个月前

AI资讯

41 阅读

在2025年底的一次访谈中，前OpenAI联合创始人、AI界知名专家Andrej Karpathy坦率地分享了他对AI编程助手彻底改变开发流程的观察和感受。Karpathy直言：“这有点伤自尊”，因为如今他80%的代码都由AI生成，而自己更多扮演的是一个“指挥实习生”的角色。尽管如此，他仍然认为这种转变“太值了”，并指出AI正在展现出某种“通用人工智能”（AGI）的初步魔法。

Karpathy表示，他的编程工作流在过去短短两个月内发生了剧烈变化。从2025年11月到12月，他逐渐从手写80%的代码过渡到了几乎完全依赖AI生成。这一变化不仅是效率的提升，更是一种思维方式的重构。他形容这一过程像是“大规模驾驭软件”的能力，AI不仅能完成常规代码，还能在复杂任务中表现出色，帮助人类快速构建原型和实现功能。

AI编程的效率与代价

虽然AI生成代码大幅提升了开发效率，但也带来了潜在问题——Karpathy称之为“理解债”。他解释道，由于审查AI生成的代码非常耗时，开发者越来越倾向于“只要能跑就先过”，这种做法长期下来会导致对整个代码库的理解逐渐模糊，甚至产生维护难题。

在多个基准测试中，Google最新推出的Gemini 3.1 Pro展现出惊人的性能跃升。尤其在解决全新逻辑模式的ARC-AGI-2测试中，3.1 Pro的得分达到77.1%，是前代3 Pro（31.1%）的两倍多，也超过了Anthropic的Opus（68.8%）和OpenAI的GPT-5.2（52.9%）。在程序设计能力方面，它在LiveCodeBench Pro上获得2887的Elo评分，显著优于其他模型。

Gemini 3.1 Pro展示出AGI的初步能力

Google在多个演示中展示了Gemini 3.1 Pro的能力，包括：

根据文字提示生成动态SVG动画，支持缩放且不失真
实时追踪国际空间站轨道的航天仪表盘
3D椋鸟群模拟，支持手势操控与动态生成音乐
将文学作品《呼啸山庄》氛围转化为现代个人网站

这些案例表明，Gemini 3.1 Pro已经可以胜任一整套专业或创意工作流，而不仅仅是回答问题。Jeff Dean展示的城市规划demo，与Karpathy的跑步仪表盘放在一起，正是这一趋势的体现：LLM不再只是辅助角色，而是成为整个应用的编排核心。

AI原生工具的崛起与传统开发模式的消退

Karpathy进一步指出，当前99%的产品仍未转向AI原生的CLI（命令行接口）模式，还在维护传统的前端界面。他以Woodway跑步机为例，强调这类设备本应是标准的AI原生传感器，却反而需要LLM进行逆向工程，获取原始数据，这种“绕远路”的方式是完全没有必要的。

他预测，随着AI助手的能力不断提升，未来我们不再需要到应用商店下载标准化App，而是由LLM几秒钟生成数百行代码，快速构建专属工具。这种趋势将推动开发模式从“以用户为中心”转向“以智能代理为中心”，应用程序将更倾向于提供API接口而非前端界面。

行业竞争与生态格局变化

尽管Gemini 3.1 Pro在多个基准测试中表现突出，尤其在成本与效率方面具有优势：

智能指数排名超越Anthropic Opus 4.6
总测试成本不到Opus的一半
API价格策略相对合理

但在工具调用与多模态任务中仍存在短板，例如在MMMU Pro基准上稍逊于前代版本。OpenAI和Anthropic也在不断更新自己的模型，行业竞争日益激烈。值得注意的是，Karpathy和Google DeepMind新晋科学家姚顺宇等业界精英的背书，进一步提升了人们对AI助手未来发展的期待。

总体来看，AI编程助手正以前所未有的速度改变着软件开发的面貌。从辅助编写到主导流程，从简单功能到复杂系统，AI的能力边界正在快速扩展。Karpathy的亲身经历与感受，既是对现状的诚实反思，也揭示了通往AGI之路的关键转变。

有点伤自尊，但太值了，Karpathy：当AI接管80%代码，我看清了AGI魔法

AI编程的效率与代价

Gemini 3.1 Pro展示出AGI的初步能力

AI原生工具的崛起与传统开发模式的消退

行业竞争与生态格局变化

链接失效反馈