智谱创始人唐杰隔空对话马斯克:赶超Claude Fable 5不用等到2027年

马斯克预言2027年Q1,唐杰当场回怼:不会那么久

一场关于中美AI差距的隔空对话,始于一名网友向马斯克的提问:“你认为中国大模型何时能达到Fable级别?智谱GLM-5.2已经缩短了差距。”马斯克随即回复,认为时间点可能在“2027年第一季度”。然而,被点名的智谱创始人唐杰教授立即现身,留下一句轻描淡写却极具分量的回应:“不会那么久。” 这一简短对答迅速引爆社交媒体,围观的科技圈迅速分裂为两派:一派认为GLM系列迭代速度惊人,年底GLM-6值得期待;另一派则冷静指出,GLM-5.2连跨对话记忆能力都未具备,仅靠Benchmark分数追平意义有限。马斯克本人也认同后一观点,强调Anthropic真正追求的是“有用的智能”,这不会体现在分数里,但会反映在收入上。

GLM-5.2开源登顶,代码能力逼近Claude Opus 4.8

这场讨论的直接导火索,是智谱AI近期上线并开源的旗舰大模型GLM-5.2。该模型在FrontierSWE编程基准测试中得分74.4,接近Anthropic顶级模型Claude Opus 4.8的水平;在全球百万用户参与盲测的前端开发评估系统Code Arena上,更是位列所有可用模型第一位。此外,在Harvey法律Agent专业领域测试中,GLM-5.2从上一代的“零分”直接冲进前三,展现极快的迭代速度。更令人瞩目的是,智谱以MIT协议全量开源GLM-5.2,该模型在综合评测中以51分登顶所有开源权重模型,大幅领先MiniMax-M3(44分)、DeepSeek V4 Pro(44分)和Kimi K2.6(43分)。对比同期Anthropic推出Claude Fable 5却因模型降智、地域限制备受指责,智谱的开源举动为其赢得了大量口碑和路人缘,股价近五个工作日累计上涨99.81%,几乎翻倍。

智谱创始人唐杰隔空对话马斯克:赶超Claude Fable 5不用等到2027年

“中国版Anthropic”争议:B端突围与底层创新基因

这场对话也再次将智谱推至“中国版Anthropic”的定位下。两家公司都带有浓厚的学院派/研究派创立基因,注重底层创新和长期价值。商业化路径上,Anthropic从B端Coding市场突围,占领专业用户心智;智谱同样在B端业务表现亮眼,拥有陡峭的增长曲线。不过,唐杰的回应暗示,智谱的追赶节奏或许比市场预期的更快——他上个月已预告“原生多模态模型将在数月内上线”,这次回应后,智谱全球化负责人也转发推文预告“大事即将发生”,意味着GLM大版本升级已逼近。

原生多模态成必争之地,智谱能否补齐短板?

尽管GLM-5.2在代码和长时程代理任务(Long-running agent tasks)上表现突出,但多模态仍是其绕不过的短板。对比来看,Kimi K2.5已于今年1月底采用原生多模态架构,阿里Qwen3.5-Omni在3月基于超1亿小时音视频数据端到端预训练上线,GPT-4o更是在去年4月就完成了原生多模态架构落地。唐杰本人也多次强调:“感知环境是完成长任务的基础,多模态不是功能附加,而是Agent真正落地的前提。” 智谱若要在年内实现对Claude Fable 5的追赶,必须在原生多模态上给出明确答案。

追平Fable5的真正挑战:后训练与自我迭代

从技术纵深看,要达到Fable 5级别,国产模型不仅要在预训练阶段把模型推向万亿级参数,更大的挑战在于后训练阶段——让模型能够(部分)跑通自我训练和自我迭代(递归式自我改进,RSI)。目前GLM-5.2在Benchmark上已接近Opus 4.8水平,但Anthropic CEO达里奥在其5月发布的《2028: Two scenarios for global AI leadership》报告中给出了两种终局判断:美国及盟友守住领先优势,或中国追赶到并驾齐驱。唐杰的“不会那么久”显然更偏向后者,但能否真正兑现,取决于智谱在多模态、长上下文记忆和后训练能力上的后续突破。