智谱创始人唐杰隔空对话马斯克:赶超Claude Fable 5不用等到2027年
马斯克预测2027,唐杰秒回“Won‘t take that long”
6月19日,一场关于中美大模型差距的隔空对话在X平台引爆。有网友提问“中国大模型何时能达到Anthropic Fable水平”,并指出智谱GLM-5.2已缩小差距。特斯拉CEO马斯克回复:“可能在2027年一季度”。但智谱创始人唐杰几乎在同一时间回应:“Won‘t take that long”(不用等那么久)。这场交锋迅速引发硅谷关注,投资大佬Marc Andreessen甚至亲自转发唐杰的回应并附上“Interesting”。唐杰的自信并非空穴来风——智谱AI刚刚发布了新一代旗舰模型GLM-5.2,该模型在代码和推理等关键维度上已展现出与Fable正面硬扛的能力。

GLM-5.2硬核实力:编程基准直逼Fable,成本仅十分之一
GLM-5.2的发布数据直接支撑了唐杰的底气。在FrontierSWE编程基准测试中,该模型得分74.4,接近Anthropic顶级模型Claude Opus 4.8的水平;在Code Arena全球百万用户盲测的前端开发评估系统上,GLM-5.2位列全球可用模型第一。唐杰本人评估,GLM-5.2的整体能力大致相当于Claude Opus 4.7到4.8之间。更关键的是,GLM-5.2以300 tokens/秒的推理速度和成本仅为美国前沿模型十分之一的优势,全权重开源发布,全球可自由下载。这并非“性能缩水”的妥协,而是对很大一部分工作负载而言已成为更优选择——相比之下,Anthropic的Fable 5虽能处理5000万行代码迁移等复杂任务,但其闭源属性与高昂成本限制了规模化落地。
美国禁令反成催化剂:开源模型抢跑颠覆路径
就在GLM-5.2发布前一天,美国商务部宣布对Anthropic的Fable 5和Mythos 5实施全球出口管制,直接向中国用户关闭入口。结果24小时后,智谱发布开源模型GLM-5.2,且在BridgeBench推理榜上以42.8分击败被封锁的Fable 5,拿下全球第一。这一时间点让“禁令反促中国AI加速”的论调获得新证据——开源模型正遵循颠覆创新路径:成本低90%(甚至更多)+定制化+数据主权,快速侵蚀闭源在规模化部署中的优势。有外媒评论:“你不能通过出口管制来阻止开源。禁令非但没有拖慢中国,反而促使开发者加速转向原本可能忽略的替代方案。”事实上,已有报道称Microsoft取消了大量内部Claude Code许可,转向自有GitHub Copilot,闭源生态的竞争者正在流失。
真实实用性之争:马斯克的分层与唐杰的底气
马斯克在回复中特意补充了一个分层:在基准测试层面,追赶进展或许令人印象深刻;但若以“真实实用性”衡量,即便2027年Q1能达到也已相当出色。他指Anthropic的优势在于提升“有用的智能”,这种能力不一定体现在分数里,但会直接反映在营收上。然而唐杰的回应和GLM-5.2的实际表现,恰恰在不断缩小这一差距——尤其是开源模型在复杂代码任务(Long-horizon agentic coding)上突破,证明开源已具备深度的“行动力”。加上美国商务部的禁令客观上加速了中国开发者转向国产模型,从“追赶者”到“并行者”的转变可能比马斯克预想的更早到来。