20万字不到1分钱，梁文锋把token价格打骨折了

3 个月前

AI资讯

44 阅读

DeepSeek token成本][大模型API 价格策略

DeepSeek创始人梁文锋在2024年4月25日宣布，DeepSeek-V4-Pro开启限时2.5折优惠，输入价格（缓存命中）降至0.25元/百万tokens。叠加折扣后，V4-Pro的缓存输入价格低至0.025元/百万tokens，V4-Flash更是降至0.02元/百万tokens，刷新了全球大模型API价格纪录。以《挪威的森林》为例，全书约20万字，若全部命中缓存输入至DeepSeek-V4-Pro，成本不到1分钱。

01 深度剖析DeepSeek的定价策略

缓存命中的永久降价
DeepSeek并非只是短期促销，而是针对缓存命中这一高频使用场景实施永久性降价。这对于RAG知识库、智能客服、文档分析等缓存命中率超过60%的应用来说，整体成本可下降90%以上。
价格锚定，重构市场预期
一旦“20万字不到1分钱”的价格感知形成，其他厂商将面临两难：跟价意味着利润空间被压缩，不跟价则需解释自身高价的价值所在。
普惠AI与规模经济
梁文锋认为AI应像基础设施一样普及，价格战不可避免。只有实现“规模经济+薄利多销”，才能让AI真正走向商业化闭环。谁能在成本结构、技术迭代和规模效应上占据优势，谁就能在竞争中存活。

20万字不到1分钱，梁文锋把token价格打骨折了

02 国产算力替代的新路径

昇腾芯片性价比凸显
华为昇腾950PR单卡价格约7万元，远低于英伟达H200的25万元。在FP8和FP4精度下，昇腾的单位算力成本甚至优于英伟达。
集群优化释放国产算力潜力
单卡性能虽不及英伟达，但通过超节点集群部署（如CloudMatrix 384），昇腾在总性能、内存容量和带宽上实现反超，适合长文本、缓存复用场景。
基建成本与能耗优势
昇腾950PR虽然单卡功耗高（600W），但单位算力功耗低65%，显著降低电力与制冷需求，整体部署成本比英伟达H20方案节省60%-70%。
推动国产芯片生态建设
DeepSeek大规模使用国产芯片，带动产业链活跃。华为昇腾、寒武纪、海光等8家国产AI芯片厂商已在V4发布当日完成适配。当日相关芯片股大幅上涨，显示市场信心。

03 梁文锋的商业化布局与挑战

从API到企业服务
DeepSeek并不止步于低价API。它试图通过价格打穿市场，再用开源模型建立生态，最终以企业级部署、调优、安全、私有化服务等承接商业化价值。
行业客户的多维需求
在金融、政务、制造等敏感行业，数据安全与可控性远比价格重要。梁文锋的策略是通过开源吸引开发者，再通过专业服务满足行业客户的高阶需求。
竞争格局下的生存逻辑
虽然K 2.6、MiniMax M3等竞品性能更强，但DeepSeek通过价格与国产生态绑定，形成差异化路线。其核心逻辑是“先跑通场景，再构建护城河”。

小结

梁文锋通过DeepSeek的降价策略，不仅降低了AI推理成本，还推动了国产算力生态的商业化进程。这种“价格打穿+国产替代+生态构建”的组合拳，可能成为国产AI模型竞争的新范式。未来，谁能在算力成本、模型性能与服务生态之间找到最佳平衡点，谁就能真正引领AI基础设施的普惠化浪潮。

20万字不到1分钱，梁文锋把token价格打骨折了

01 深度剖析DeepSeek的定价策略

02 国产算力替代的新路径

03 梁文锋的商业化布局与挑战

小结

链接失效反馈