20万字不到1分钱,梁文锋把token价格打骨折了

DeepSeek创始人梁文锋在2024年4月25日宣布,DeepSeek-V4-Pro开启限时2.5折优惠,输入价格(缓存命中)降至0.25元/百万tokens。叠加折扣后,V4-Pro的缓存输入价格低至0.025元/百万tokens,V4-Flash更是降至0.02元/百万tokens,刷新了全球大模型API价格纪录。以《挪威的森林》为例,全书约20万字,若全部命中缓存输入至DeepSeek-V4-Pro,成本不到1分钱。

01 深度剖析DeepSeek的定价策略

  • 缓存命中的永久降价
    DeepSeek并非只是短期促销,而是针对缓存命中这一高频使用场景实施永久性降价。这对于RAG知识库、智能客服、文档分析等缓存命中率超过60%的应用来说,整体成本可下降90%以上。

  • 价格锚定,重构市场预期
    一旦“20万字不到1分钱”的价格感知形成,其他厂商将面临两难:跟价意味着利润空间被压缩,不跟价则需解释自身高价的价值所在。

  • 普惠AI与规模经济
    梁文锋认为AI应像基础设施一样普及,价格战不可避免。只有实现“规模经济+薄利多销”,才能让AI真正走向商业化闭环。谁能在成本结构、技术迭代和规模效应上占据优势,谁就能在竞争中存活。

20万字不到1分钱,梁文锋把token价格打骨折了

02 国产算力替代的新路径

  • 昇腾芯片性价比凸显
    华为昇腾950PR单卡价格约7万元,远低于英伟达H200的25万元。在FP8和FP4精度下,昇腾的单位算力成本甚至优于英伟达。

  • 集群优化释放国产算力潜力
    单卡性能虽不及英伟达,但通过超节点集群部署(如CloudMatrix 384),昇腾在总性能、内存容量和带宽上实现反超,适合长文本、缓存复用场景。

  • 基建成本与能耗优势
    昇腾950PR虽然单卡功耗高(600W),但单位算力功耗低65%,显著降低电力与制冷需求,整体部署成本比英伟达H20方案节省60%-70%。

  • 推动国产芯片生态建设
    DeepSeek大规模使用国产芯片,带动产业链活跃。华为昇腾、寒武纪、海光等8家国产AI芯片厂商已在V4发布当日完成适配。当日相关芯片股大幅上涨,显示市场信心。

03 梁文锋的商业化布局与挑战

  • 从API到企业服务
    DeepSeek并不止步于低价API。它试图通过价格打穿市场,再用开源模型建立生态,最终以企业级部署、调优、安全、私有化服务等承接商业化价值。

  • 行业客户的多维需求
    在金融、政务、制造等敏感行业,数据安全与可控性远比价格重要。梁文锋的策略是通过开源吸引开发者,再通过专业服务满足行业客户的高阶需求。

  • 竞争格局下的生存逻辑
    虽然K 2.6、MiniMax M3等竞品性能更强,但DeepSeek通过价格与国产生态绑定,形成差异化路线。其核心逻辑是“先跑通场景,再构建护城河”。

小结

梁文锋通过DeepSeek的降价策略,不仅降低了AI推理成本,还推动了国产算力生态的商业化进程。这种“价格打穿+国产替代+生态构建”的组合拳,可能成为国产AI模型竞争的新范式。未来,谁能在算力成本、模型性能与服务生态之间找到最佳平衡点,谁就能真正引领AI基础设施的普惠化浪潮。