智谱 GLM-5.1 模型公布,所有 Coding Plan 用户均可调用

智谱 AI 近期正式宣布,其旗舰编程模型 GLM-5.1 已面向所有 GLM Coding Plan 订阅用户全面开放。这一举措标志着 GLM-5 已完成从初期的算力扩容到全量用户覆盖的过渡。作为一款具备“系统性思维”的 Agentic Engineering 模型,GLM-5 在 SWE-bench-Verified 等多项基准测试中取得了开源模型的 SOTA(最先进)成绩,性能甚至超越 Gemini 3 Pro。与此同时,智谱已与华为昇腾、摩尔线程、寒武纪等国内多家主流算力平台完成深度适配,确保了模型在多元算力环境下的高效运行。

开放范围与套餐支持详情

根据官方公告及 IT之家的报道,GLM-5 的开放进程已按计划推进:

  • Pro 与 Max 套餐:自 2 月 13 日起已正式支持 GLM-5 的调用,用户可立即在主流 AI 编码工具中使用。
  • Lite 套餐:官方预计在 4 月内完成支持,届时入门级用户也能体验该模型。
  • 新模型支持:GLM-5-Turbo 也已在 Max 套餐中上线,Pro 和 Lite 套餐将稍晚支持。

此外,GLM Coding Plan 的权益还包括:

  • 扩展能力:套餐内包含专属的图像视频理解、联网搜索、网页读取及开源仓库 MCP 等功能。
  • 特别权益:新上线的 GLM in Excel (Beta) 插件,允许用户通过自然语言在 Excel 中进行数据解释、公式生成和图表可视化等操作。

智谱 GLM-5.1 模型公布,所有 Coding Plan 用户均可调用

定价策略与用量消耗机制

随着 GLM-5 的全面开放,智谱调整了定价策略并明确了高阶模型的消耗规则,旨在平衡资源利用与用户体验。

  • 套餐价格:GLM Coding Pro 套餐订阅价格为 149 元/月(包年/包季有折扣)。有消息指出,智谱近期取消了首购优惠,并对套餐价格进行了结构性调整,涨幅在 30% 至 60% 不等,API 调用价格也有显著提升。
  • 消耗系数:由于 GLM-5 定位为高阶模型(对标 Claude Opus),其调用消耗额度实行“错峰定价”机制:
    • 高峰期(每日 14:00 - 18:00):按 3 倍 系数扣除。
    • 非高峰期:按 2 倍 系数扣除。
  • 限时福利:为缓解初期压力,GLM-5-Turbo 在非高峰期仅按 1 倍 系数抵扣,该优惠将持续至 4 月底。
  • 额度估算:Pro 套餐在普通模型下约支持 400-2000 次 prompts,具体取决于项目复杂度。官方建议用户在普通任务中继续使用 GLM-4.7,以避免额度过快消耗。

技术突破与基准表现

GLM-5 的核心亮点在于其从“Vibe Coding”到“Agentic Engineering”的进化,实现了从单纯代码生成到复杂工程逻辑理解的跨越。

  • 编程与智能体能力:在 SWE-bench-Verified 和 Terminal Bench 2.0 测试中,GLM-5 获得 77.8 和 56.2 的开源模型 SOTA 分数。
  • 多工具与复杂场景:在 BrowseComp(联网检索)、MCP-Atlas(工具调用)以及 τ²-Bench 等测试中,同样取得了开源最佳表现,证明了其在复杂多步骤任务执行和模拟经营能力上的优势。
  • 国产算力适配:智谱与国产芯片合作伙伴的深度推理适配(Day-0 适配),不仅解决了扩容时期的算力瓶颈,也为中国 AI 产业的自主可控提供了技术范本。

市场影响与产业预期

GLM-5 的发布及提价策略,在业界引发了关于大模型商业模式的广泛讨论。

  • 打破价格战预期:市场分析认为,智谱取消优惠并提价的做法,打破了行业对“价格战”的通缩预期。这证实了在 Coding 与 Agent 等高价值场景下,用户存在刚性依赖,厂商议价权正在回归,商业模式正从“烧钱获客”转向“SaaS 化高质量增长”。
  • 算力与边缘计算需求井喷:随着 GLM-5 参数量的激增,以及多模态场景(如字节 Seedance 2.0)带来的 Token 需求爆发,国产算力底座(如海光、寒武纪)及边缘计算(CDN)需求显著提升。由于多模态内容无法复用缓存且用户对延迟容忍度降低,供需趋紧已推动国内 CDN 价格上涨。
  • 行业预期:若 Q1 的提价策略能获得市场数据验证,AI 板块的逻辑将从主题炒作切实切换至业绩兑现阶段。