20万字不到1分钱,梁文锋把token价格打骨折了
DeepSeek创始人梁文锋在2024年4月25日宣布,DeepSeek-V4-Pro开启限时2.5折优惠,输入价格(缓存命中)降至0.25元/百万tokens。叠加折扣后,V4-Pro的缓存输入价格低至0.025元/百万tokens,V4-Flash更是降至0.02元/百万tokens,刷新了全球大模型API价格纪录。以《挪威的森林》为例,全书约20万字,若全部命中缓存输入至DeepSeek-V4-Pro,成本不到1分钱。
01 深度剖析DeepSeek的定价策略
-
缓存命中的永久降价
DeepSeek并非只是短期促销,而是针对缓存命中这一高频使用场景实施永久性降价。这对于RAG知识库、智能客服、文档分析等缓存命中率超过60%的应用来说,整体成本可下降90%以上。 -
价格锚定,重构市场预期
一旦“20万字不到1分钱”的价格感知形成,其他厂商将面临两难:跟价意味着利润空间被压缩,不跟价则需解释自身高价的价值所在。 -
普惠AI与规模经济
梁文锋认为AI应像基础设施一样普及,价格战不可避免。只有实现“规模经济+薄利多销”,才能让AI真正走向商业化闭环。谁能在成本结构、技术迭代和规模效应上占据优势,谁就能在竞争中存活。

02 国产算力替代的新路径
-
昇腾芯片性价比凸显
华为昇腾950PR单卡价格约7万元,远低于英伟达H200的25万元。在FP8和FP4精度下,昇腾的单位算力成本甚至优于英伟达。 -
集群优化释放国产算力潜力
单卡性能虽不及英伟达,但通过超节点集群部署(如CloudMatrix 384),昇腾在总性能、内存容量和带宽上实现反超,适合长文本、缓存复用场景。 -
基建成本与能耗优势
昇腾950PR虽然单卡功耗高(600W),但单位算力功耗低65%,显著降低电力与制冷需求,整体部署成本比英伟达H20方案节省60%-70%。 -
推动国产芯片生态建设
DeepSeek大规模使用国产芯片,带动产业链活跃。华为昇腾、寒武纪、海光等8家国产AI芯片厂商已在V4发布当日完成适配。当日相关芯片股大幅上涨,显示市场信心。
03 梁文锋的商业化布局与挑战
-
从API到企业服务
DeepSeek并不止步于低价API。它试图通过价格打穿市场,再用开源模型建立生态,最终以企业级部署、调优、安全、私有化服务等承接商业化价值。 -
行业客户的多维需求
在金融、政务、制造等敏感行业,数据安全与可控性远比价格重要。梁文锋的策略是通过开源吸引开发者,再通过专业服务满足行业客户的高阶需求。 -
竞争格局下的生存逻辑
虽然K 2.6、MiniMax M3等竞品性能更强,但DeepSeek通过价格与国产生态绑定,形成差异化路线。其核心逻辑是“先跑通场景,再构建护城河”。
小结
梁文锋通过DeepSeek的降价策略,不仅降低了AI推理成本,还推动了国产算力生态的商业化进程。这种“价格打穿+国产替代+生态构建”的组合拳,可能成为国产AI模型竞争的新范式。未来,谁能在算力成本、模型性能与服务生态之间找到最佳平衡点,谁就能真正引领AI基础设施的普惠化浪潮。