天天卖断货的 GLM-5.2，用起来到底值不值？

5 天前

AI资讯

16 阅读

代码能力长上下文模型评测][GLM-5.2

真1M上下文：从“塞满就忘”到4小时不掉链

很多标称百万token的模型跑到30万就开始“失忆”，但GLM-5.2的1M上下文是实打实能用的。实测中，它连续自主工作4小时，在17万token的长程任务里，自己写代码、组了29个review智能体挑毛病、揪出18个bug并全部修复，最后还跑完Headless Chrome自动化测试。更关键的是，它能把一整月几十万token的服务器日志吞进去，精确追溯到月初的某条日志行号，把“连接池满载→慢性积累→级联503”的因果链串起来——短上下文模型早在那一步就把“火种”丢弃了。智谱还专门用ZCode 3.0测试台做了深度优化，长程推理、工具调用和大型工程执行链路都针对GLM系列调校，解决了过去模型到了256k后能力骤降的痛点。

天天卖断货的 GLM-5.2，用起来到底值不值？

代码实战：机械钟、点球大战和迷你Excel的喜与忧

在真实编码场景中，GLM-5.2展现了扎实的工程能力，但也有明显短板：

机械钟：单HTML文件生成约925行纯前端代码，零外部依赖，全靠SVG path一笔笔算齿轮齿形、月相暗线。最惊艳的是它不堆屎山——发现错了敢整段重写。不过颜值上还有进步空间。
互动点球大战：用Three.js + Cannon.js实现五轮攻防、三档AI难度、马格努斯弧线、加时赛、1400个观众剪影。更老练的是，它刻意把守门员排除在物理引擎外，手写距离检测，彻底避开了Cannon.js的鬼畜弹跳和“球穿门将”bug。
迷你Excel：花一小时用纯浏览器还原Excel桌面端核心体验。但执行节奏失衡——前14分钟只停留在“设计讨论+零散代码片段”，从未写出可运行HTML。模型“想得多”，但也因此差点没把功能跑出来。

整体来看，它在无外部依赖下产出干净代码，且在发现自身Bug后主动推倒重写，但在需要快速交付完整可运行文件时，容易陷入过度设计。

替代Fable 5：供应安全与极致性价比的“国产替代”公式

Anthropic的Fable 5上线仅72小时就被美国商务部下架，全球依赖它构建产品的团队服务直接挂掉。智谱在第二天全量开放GLM-5.2，直接用MIT协议开源、无地域限制，给中国开发者握住了钥匙。参数上，744B总参数MoE架构，每次激活约40B，百万token窗口。最关键的是价格：Coding Plan最低档49元人民币/月（约7美元），Max档也比同等能力的海外模型便宜一个数量级。能力接近、供应稳定、价格更低——三样凑齐，正是典型的“国产替代”公式。发布后智谱股价一度暴涨40%，但市场情绪过热也让人冷静：如果Fable 5重新上线，GLM-5.2能否留住用户？至少它打开了一扇门，钥匙在开发者手里。

天天卖断货的 GLM-5.2，用起来到底值不值？

真1M上下文：从“塞满就忘”到4小时不掉链

代码实战：机械钟、点球大战和迷你Excel的喜与忧

替代Fable 5：供应安全与极致性价比的“国产替代”公式

链接失效反馈