性价比拉满:Grok Build 0.1 打响 AI 编程实战,马斯克称物超所值

终端里的编程智能体:Grok Build如何规划任务、改代码、跑测试

5月14日,xAI悄然上线了Grok Build的早期Beta版本,将其定位为“编程智能体和CLI(命令行工具)”。与普通的代码补全工具不同,Grok Build是一个跑在终端里、能自主规划任务并动手改代码的智能体。安装后,只需在项目目录下敲入grok,它便开始工作:你可以让它解释整个代码仓库的结构,也可以直接丢一个任务,比如“给这个API加上限流”——它会自己定位文件、修改代码、运行测试、再自我纠错。

为了让开发者灵活使用,Grok Build提供了三种交互模式:

  • TUI(终端图形交互界面):全屏显示,支持鼠标操作,面对复杂任务会先输出一份执行计划,等待用户确认后再动手,每一步改动都以清晰的diff(差异对比)呈现。
  • Headless(无界面模式):适合嵌入脚本和自动化流程,无需人工干预。
  • ACP(智能体客户端协议):可接入其他应用,扩展使用场景。

此外,Grok Build还支持子智能体并行处理任务、MCP(模型上下文协议)服务器、skills/plugins/marketplace扩展体系,甚至内置了/imagine生成图片和/imagine-video生成视频的斜杠命令。xAI显然意图明确:这不是一个聊天机器人,而是一个完整的开发者工作流入口,直接对标Claude Code、Codex CLI和Cursor的智能体。

底座grok-build-0.1登场,V9还在路上

驱动Grok Build的核心是一个专门训练的模型——grok-build-0.1。根据xAI官方文档,这是一款专为编程定制的模型,支持文本和图像输入,具备原生工具调用、结构化输出和推理能力,上下文窗口达256K(约25.6万token)。它被训练成能在一个长链路里反复循环:读问题、写代码、用终端、查错、改错。

性价比拉满:Grok Build 0.1 打响 AI 编程实战,马斯克称物超所值

值得注意的是,grok-build-0.1已单独上架xAI API,开发者可以将其直接嵌入自己的智能体循环或IDE集成,不必依赖Grok Build的外壳。而更早的grok-code-fast-1已在5月中旬退役,xAI建议所有代码工作负载迁移至grok-build-0.1。目前,xAI官方模型页仍将Grok 4.3列为通用主模型,但在“编程”用途上已明确对应Grok Build 0.1。马斯克口中的V8、V9是基础模型代际编号(V8约0.5T参数,V9达1.5T),与对外产品版本号(v4.2/4.3)是两套体系;grok-build-0.1是否利用V9的预训练成果,xAI尚未公开说明。

马斯克坦承落后,1.5T参数V9剑指六月

xAI在编程场景上的短板由来已久。马斯克此前公开承认过落后,甚至要求团队“把Grok做到能在各类任务上追平Claude”。Grok Build便是这场追赶赛的第一个产品。但马斯克的野心不止于此:他接连曝光了V9模型的进展,称其参数规模从0.5T跃升至1.5T,在数据整理、训练方法、模型规模等每个方面都显著优于V8,并针对Blackwell架构进行了优化。

具体来看V9的三大升级维度:

  • 参数规模三倍扩张:从0.5T涨到1.5T,理论上提升了模型容量、复杂任务建模能力和长链路工具调用稳定性。
  • 硬件架构全面换代:V8训练在Hopper芯片上,V9则面向Blackwell架构优化,后者拥有更高的互联带宽、更强的低精度计算能力,专为万亿级模型训练和推理设计。
  • 真实的开发者数据:马斯克直言V8的数据质量存在缺陷——全面性不够、比例不对。V9的训练将加入Cursor等平台的开发者过程数据(补全、回退、纠错、与智能体互动),并经过SFT(监督微调)和RL(强化学习),整个流程还需3到4周。

马斯克专门发帖梳理了xAI“令人困惑”的版本号:内部V9参数1.5T,面向公开的v4.2基于V8(仅0.5T参数),并称“只要xAI拿出一个真正SOTA的模型,Grok Build一夜之间就能和Codex、Claude Code正面竞争”。他预计V9将在6月以公开版形式接受检验,并称“物超所值”。

六月正面交锋:AI编程三国杀格局初现

Grok Build的推出,标志着xAI正式杀入AI编程主战场。目前,它与Claude Code、OpenAI Codex以及Cursor形成了四方角力的局面。Claude Code保持着极高的迭代密度(最快两天内完成bug修复并发版),OpenAI的Codex持续小步推进,Cursor作为IDE平台则在加深智能体能力、扩展模型选择、增强平台粘性。

Grok Build的准入策略也在快速放宽:最初仅面向SuperGrok Heavy订阅用户,5月25日扩大到所有SuperGrok和X Premium Plus用户,从一个高门槛的小范围Beta变成了更多付费用户能上手的工具。与此同时,xAI还与Kilo Code、OpenCode等第三方平台合作,将Grok Build的模型能力接入更多开发环境。

真正的较量将在6月展开:V9上线后,参数翻3倍是否等于能力翻3倍?1.5T能不能在编程基准上拉开与Claude、GPT的差距?所有答案都将由实战给出。正如马斯克所说,“按正常标准很短,但在AI领域算很长”。这场AI编程的三国杀,才刚刚开始。