Grok最新模型吃上Cursor「加餐」,马斯克:Coding实现巨大改进
xAI发布Grok 4系列:跳票3.5直接上4,编程模型成下一站
xAI在7月10日的直播中正式推出Grok 4系列,跳过原定的Grok 3.5版本,直接发布通用模型Grok 4和重型版Grok 4 Heavy。马斯克开场强调,两款模型均为纯推理模型,无非推理模式。更值得关注的是,xAI宣布未来三个月内将陆续推出专为编码任务设计的Coding Model、多模态代理和视频生成模型。尽管通用模型已在多项基准测试中碾压o3、Gemini和Claude(HLE准确率44.4% vs 26.9%),马斯克明确表示“今天不过多讨论Grok 4的编码性能”,暗示编程专属模型才是重头戏。
Grok Code Fast-1抢跑:轻量推理模型专攻开发者场景
在Grok 4正式发布后不久,xAI悄然上线了Grok 4系列中的轻量级编程模型grok-code-fast-1。该模型主打快速且经济的推理能力,具备自主处理任务的能力,上下文窗口达13万tokens。尽管目前仅支持文本模态,但xAI内部测试显示,其代码生成速度和准确率较此前Grok 3有数量级提升。有爆料称,该模型或为Grok 4 Code的降本版本,旨在吸引开发者快速接入。
Cursor 500亿估值加持:Grok编程模型吃上「加餐」整合传闻
AI编程初创公司Cursor近日完成20亿美元融资,估值飙至500亿美元,几乎较半年前翻倍。就在同一窗口期,消息称xAI正与Cursor洽谈深度整合——Grok 4的专用编码模型将作为可选后端引擎嵌入Cursor。尽管xAI已推送Grok 4.3 Early Access测试版(仅限Grok Heavy订阅用户),但业内分析认为,与其独立开发专用编程模型,不如直接依托Grok 4.3的强大推理能力,通过API对接Cursor等流行的AI代码编辑器。马斯克也在X上呼应:“Coding实现巨大改进”,暗示编程体验将因模型与工具的协同而质变。
多方围剿:微软同日集成Claude Opus 4.7,编程工具战局白热化
在xAI与Cursor联手传闻发酵的同时,微软打破与OpenAI的排他惯例,在GitHub Copilot等9大开发环境中首日集成Anthropic的Claude Opus 4.7。GitHub Copilot Pro+用户的默认模型将很快替换为Opus 4.7。这意味着编程AI赛道已演变为多模型混合战。xAI选择此时高调切入,凭借Grok 4在HLE、AIME25等硬核基准上的压倒性得分,以及Cursor平台的开发者粘性,有望在编程智能化市场中后发制人。马斯克甚至放出豪言:下一代编码模型将让程序员“直接与AI对话就能生成完整系统”。