超越 Claude Fable 5:智谱 GLM 5.2 登顶 Design Arena 网页设计 AI 榜单
Design Arena登顶:GLM-5.2用“品味”击败Fable 5
在Arena.ai旗下专门衡量模型前端审美与设计能力的Design Arena上,GLM-5.2取得全球第一的表现,超越此前所有闭源与开源模型。第三方评测机构AICodeKing的KingBench评价GLM-5.2“代码洁净度极高、UX设计品味出众、One-shot能力强”。量子位报道引用Arena官方说法称这是“令人难以置信的里程碑”。与此同时,在Code Arena前端榜单中,GLM-5.2排名第二,仅次于Fable 5,领先Claude Opus 4.7 Thinking达29分;Agent Arena中,GLM-5.2作为开源模型取得最高分,与Claude Opus 4.8(非思考模式)表现相当。
开源模型的新里程碑:753B参数MIT许可,百万上下文可用
GLM-5.2拥有753B参数,采用MIT开源协议,权重已上传HuggingFace(zai-org/GLM-5.2),支持vLLM / SGLang本地部署。同步发布FP8量化版本(GLM-5.2-FP8),降低显存需求。ChatGLM网页版同步接入GLM-5.2,并上线1M上下文窗口。这意味着开发者可以免费下载、商用部署,并且能够一次性处理相当于数本厚书的长文本或大型项目代码。官方称,GLM-5.2已与华为昇腾、平头哥、摩尔线程等国产算力平台完成推理适配,Day 0即可在国产芯片上运行。

实测直击:从《文明》游戏到跨文件追Bug,百万上下文实战
多家媒体进行了深度实测。智东西让GLM-5.2从零开发一款《文明》风格策略游戏,从M0迭代至M4版本,总计使用87万上下文窗口,修复16个bug。模型能记住30万token之前定下的开发规则,自主判断加入战斗系统、科技树等子系统,甚至在M4阶段主动优化UI设计,提升审美。量子位测试了大型开源项目Appsmith的架构分析、OpenWebUI的跨文件Bug定位以及新功能开发。GLM-5.2能精准定位前端chunk与SSE协议之间的隐藏Bug,并在后续测试中跑通38个后端测试。博主toyama nao评价“如果Opus是GLM-5.2冒充的,用户可能真的分辨不出来”。
技术解密:百万长上下文背后的工程优化
GLM-5.2实现1M上下文的核心挑战在于注意力机制的计算复杂度和显存占用。智谱从推理基础设施和模型架构层协同优化:引入IndexShare、KVShare、LayerSplit和HiSparse组合方案。MTP层采用IndexShare,多步推测解码中仅第一步计算索引器,后续复用;LayerSplit针对Coding Agent长上下文高缓存命中率特点,每张GPU仅持有部分层KV Cache,配合计算与广播重叠机制;HiSparse分层内存系统将非活跃KV缓存卸载至主机内存,维持热点缓存区,实现“用得起”的长序列推理。实验显示,在32k-1024k请求长度区间,系统吞吐量较GLM-5.1提升3%-192%,上下文越长收益越显著。
格局重塑:AI编程“御三家”成型,开源路线崛起
随着Fable 5下线,开发者需要寻找替代方案。GLM-5.2凭借全球可用编程模型第一的成绩,正在进入由Claude、GPT组成的顶级俱乐部。量子位将这一格局称为“Anthropic、OpenAI、智谱构成的Coding御三家”。海外开发者反馈GLM-5.2“接近Opus级体验”。与闭源模型不同,GLM-5.2的开源特性让开发者可以私有化部署、接入自身工具链,在长程工程任务中持续工作。当AI编程进入理解整库、跨模块重构、长上下文持续作业的硬核阶段,GLM-5.2代表的开源长程Coding Agent路线,正成为与Claude Code、OpenAI Codex并列的主流选择。