超越 Claude Fable 5：智谱 GLM 5.2 登顶 Design Arena 网页设计 AI 榜单

4 天前

AI资讯

20 阅读

网页设计 AI评测 Design GLM-5.2 Arena

Design Arena登顶：GLM-5.2用“品味”击败Fable 5

在Arena.ai旗下专门衡量模型前端审美与设计能力的Design Arena上，GLM-5.2取得全球第一的表现，超越此前所有闭源与开源模型。第三方评测机构AICodeKing的KingBench评价GLM-5.2“代码洁净度极高、UX设计品味出众、One-shot能力强”。量子位报道引用Arena官方说法称这是“令人难以置信的里程碑”。与此同时，在Code Arena前端榜单中，GLM-5.2排名第二，仅次于Fable 5，领先Claude Opus 4.7 Thinking达29分；Agent Arena中，GLM-5.2作为开源模型取得最高分，与Claude Opus 4.8（非思考模式）表现相当。

开源模型的新里程碑：753B参数MIT许可，百万上下文可用

GLM-5.2拥有753B参数，采用MIT开源协议，权重已上传HuggingFace（zai-org/GLM-5.2），支持vLLM / SGLang本地部署。同步发布FP8量化版本（GLM-5.2-FP8），降低显存需求。ChatGLM网页版同步接入GLM-5.2，并上线1M上下文窗口。这意味着开发者可以免费下载、商用部署，并且能够一次性处理相当于数本厚书的长文本或大型项目代码。官方称，GLM-5.2已与华为昇腾、平头哥、摩尔线程等国产算力平台完成推理适配，Day 0即可在国产芯片上运行。

超越 Claude Fable 5：智谱 GLM 5.2 登顶 Design Arena 网页设计 AI 榜单

实测直击：从《文明》游戏到跨文件追Bug，百万上下文实战

多家媒体进行了深度实测。智东西让GLM-5.2从零开发一款《文明》风格策略游戏，从M0迭代至M4版本，总计使用87万上下文窗口，修复16个bug。模型能记住30万token之前定下的开发规则，自主判断加入战斗系统、科技树等子系统，甚至在M4阶段主动优化UI设计，提升审美。量子位测试了大型开源项目Appsmith的架构分析、OpenWebUI的跨文件Bug定位以及新功能开发。GLM-5.2能精准定位前端chunk与SSE协议之间的隐藏Bug，并在后续测试中跑通38个后端测试。博主toyama nao评价“如果Opus是GLM-5.2冒充的，用户可能真的分辨不出来”。

技术解密：百万长上下文背后的工程优化

GLM-5.2实现1M上下文的核心挑战在于注意力机制的计算复杂度和显存占用。智谱从推理基础设施和模型架构层协同优化：引入IndexShare、KVShare、LayerSplit和HiSparse组合方案。MTP层采用IndexShare，多步推测解码中仅第一步计算索引器，后续复用；LayerSplit针对Coding Agent长上下文高缓存命中率特点，每张GPU仅持有部分层KV Cache，配合计算与广播重叠机制；HiSparse分层内存系统将非活跃KV缓存卸载至主机内存，维持热点缓存区，实现“用得起”的长序列推理。实验显示，在32k-1024k请求长度区间，系统吞吐量较GLM-5.1提升3%-192%，上下文越长收益越显著。

格局重塑：AI编程“御三家”成型，开源路线崛起

随着Fable 5下线，开发者需要寻找替代方案。GLM-5.2凭借全球可用编程模型第一的成绩，正在进入由Claude、GPT组成的顶级俱乐部。量子位将这一格局称为“Anthropic、OpenAI、智谱构成的Coding御三家”。海外开发者反馈GLM-5.2“接近Opus级体验”。与闭源模型不同，GLM-5.2的开源特性让开发者可以私有化部署、接入自身工具链，在长程工程任务中持续工作。当AI编程进入理解整库、跨模块重构、长上下文持续作业的硬核阶段，GLM-5.2代表的开源长程Coding Agent路线，正成为与Claude Code、OpenAI Codex并列的主流选择。

超越 Claude Fable 5：智谱 GLM 5.2 登顶 Design Arena 网页设计 AI 榜单

Design Arena登顶：GLM-5.2用“品味”击败Fable 5

开源模型的新里程碑：753B参数MIT许可，百万上下文可用

实测直击：从《文明》游戏到跨文件追Bug，百万上下文实战

技术解密：百万长上下文背后的工程优化

格局重塑：AI编程“御三家”成型，开源路线崛起

链接失效反馈