有点伤自尊,但太值了,Karpathy:当AI接管80%代码,我看清了AGI魔法
在2025年底的一次访谈中,前OpenAI联合创始人、AI界知名专家Andrej Karpathy坦率地分享了他对AI编程助手彻底改变开发流程的观察和感受。Karpathy直言:“这有点伤自尊”,因为如今他80%的代码都由AI生成,而自己更多扮演的是一个“指挥实习生”的角色。尽管如此,他仍然认为这种转变“太值了”,并指出AI正在展现出某种“通用人工智能”(AGI)的初步魔法。
Karpathy表示,他的编程工作流在过去短短两个月内发生了剧烈变化。从2025年11月到12月,他逐渐从手写80%的代码过渡到了几乎完全依赖AI生成。这一变化不仅是效率的提升,更是一种思维方式的重构。他形容这一过程像是“大规模驾驭软件”的能力,AI不仅能完成常规代码,还能在复杂任务中表现出色,帮助人类快速构建原型和实现功能。
AI编程的效率与代价
虽然AI生成代码大幅提升了开发效率,但也带来了潜在问题——Karpathy称之为“理解债”。他解释道,由于审查AI生成的代码非常耗时,开发者越来越倾向于“只要能跑就先过”,这种做法长期下来会导致对整个代码库的理解逐渐模糊,甚至产生维护难题。
在多个基准测试中,Google最新推出的Gemini 3.1 Pro展现出惊人的性能跃升。尤其在解决全新逻辑模式的ARC-AGI-2测试中,3.1 Pro的得分达到77.1%,是前代3 Pro(31.1%)的两倍多,也超过了Anthropic的Opus(68.8%)和OpenAI的GPT-5.2(52.9%)。在程序设计能力方面,它在LiveCodeBench Pro上获得2887的Elo评分,显著优于其他模型。
Gemini 3.1 Pro展示出AGI的初步能力
Google在多个演示中展示了Gemini 3.1 Pro的能力,包括:
- 根据文字提示生成动态SVG动画,支持缩放且不失真
- 实时追踪国际空间站轨道的航天仪表盘
- 3D椋鸟群模拟,支持手势操控与动态生成音乐
- 将文学作品《呼啸山庄》氛围转化为现代个人网站
这些案例表明,Gemini 3.1 Pro已经可以胜任一整套专业或创意工作流,而不仅仅是回答问题。Jeff Dean展示的城市规划demo,与Karpathy的跑步仪表盘放在一起,正是这一趋势的体现:LLM不再只是辅助角色,而是成为整个应用的编排核心。
AI原生工具的崛起与传统开发模式的消退
Karpathy进一步指出,当前99%的产品仍未转向AI原生的CLI(命令行接口)模式,还在维护传统的前端界面。他以Woodway跑步机为例,强调这类设备本应是标准的AI原生传感器,却反而需要LLM进行逆向工程,获取原始数据,这种“绕远路”的方式是完全没有必要的。
他预测,随着AI助手的能力不断提升,未来我们不再需要到应用商店下载标准化App,而是由LLM几秒钟生成数百行代码,快速构建专属工具。这种趋势将推动开发模式从“以用户为中心”转向“以智能代理为中心”,应用程序将更倾向于提供API接口而非前端界面。
行业竞争与生态格局变化
尽管Gemini 3.1 Pro在多个基准测试中表现突出,尤其在成本与效率方面具有优势:
- 智能指数排名超越Anthropic Opus 4.6
- 总测试成本不到Opus的一半
- API价格策略相对合理
但在工具调用与多模态任务中仍存在短板,例如在MMMU Pro基准上稍逊于前代版本。OpenAI和Anthropic也在不断更新自己的模型,行业竞争日益激烈。值得注意的是,Karpathy和Google DeepMind新晋科学家姚顺宇等业界精英的背书,进一步提升了人们对AI助手未来发展的期待。
总体来看,AI编程助手正以前所未有的速度改变着软件开发的面貌。从辅助编写到主导流程,从简单功能到复杂系统,AI的能力边界正在快速扩展。Karpathy的亲身经历与感受,既是对现状的诚实反思,也揭示了通往AGI之路的关键转变。