天天卖断货的 GLM-5.2,用起来到底值不值?

真1M上下文:从“塞满就忘”到4小时不掉链

很多标称百万token的模型跑到30万就开始“失忆”,但GLM-5.2的1M上下文是实打实能用的。实测中,它连续自主工作4小时,在17万token的长程任务里,自己写代码、组了29个review智能体挑毛病、揪出18个bug并全部修复,最后还跑完Headless Chrome自动化测试。更关键的是,它能把一整月几十万token的服务器日志吞进去,精确追溯到月初的某条日志行号,把“连接池满载→慢性积累→级联503”的因果链串起来——短上下文模型早在那一步就把“火种”丢弃了。智谱还专门用ZCode 3.0测试台做了深度优化,长程推理、工具调用和大型工程执行链路都针对GLM系列调校,解决了过去模型到了256k后能力骤降的痛点。

天天卖断货的 GLM-5.2,用起来到底值不值?

代码实战:机械钟、点球大战和迷你Excel的喜与忧

在真实编码场景中,GLM-5.2展现了扎实的工程能力,但也有明显短板:

  • 机械钟:单HTML文件生成约925行纯前端代码,零外部依赖,全靠SVG path一笔笔算齿轮齿形、月相暗线。最惊艳的是它不堆屎山——发现错了敢整段重写。不过颜值上还有进步空间。
  • 互动点球大战:用Three.js + Cannon.js实现五轮攻防、三档AI难度、马格努斯弧线、加时赛、1400个观众剪影。更老练的是,它刻意把守门员排除在物理引擎外,手写距离检测,彻底避开了Cannon.js的鬼畜弹跳和“球穿门将”bug。
  • 迷你Excel:花一小时用纯浏览器还原Excel桌面端核心体验。但执行节奏失衡——前14分钟只停留在“设计讨论+零散代码片段”,从未写出可运行HTML。模型“想得多”,但也因此差点没把功能跑出来。

整体来看,它在无外部依赖下产出干净代码,且在发现自身Bug后主动推倒重写,但在需要快速交付完整可运行文件时,容易陷入过度设计。

替代Fable 5:供应安全与极致性价比的“国产替代”公式

Anthropic的Fable 5上线仅72小时就被美国商务部下架,全球依赖它构建产品的团队服务直接挂掉。智谱在第二天全量开放GLM-5.2,直接用MIT协议开源、无地域限制,给中国开发者握住了钥匙。参数上,744B总参数MoE架构,每次激活约40B,百万token窗口。最关键的是价格:Coding Plan最低档49元人民币/月(约7美元),Max档也比同等能力的海外模型便宜一个数量级。能力接近、供应稳定、价格更低——三样凑齐,正是典型的“国产替代”公式。发布后智谱股价一度暴涨40%,但市场情绪过热也让人冷静:如果Fable 5重新上线,GLM-5.2能否留住用户?至少它打开了一扇门,钥匙在开发者手里。