小米跟了DeepSeek价格战！直降99%，全面对标

1 个月前

AI资讯

53 阅读

DeepSeek AI大模型小米价格战

在DeepSeek以“骨折价”重塑AI定价体系一个月后，小米于5月27日正式加入战局。旗下MiMo-V2.5系列API宣布永久降价，最高降幅99%，且不再区分上下文窗口长度，并优化TokenPlan计费体系，同等价格下用量提升5-8倍。这一举措被外界视为对DeepSeek价格战的直接回应，也意味着AI大模型市场正式进入“白菜价”时代。

小米MiMo-V2.5直降99%：一场蓄谋已久的跟进

5月27日0时，小米旗下MiMo大模型突然发布公告，宣布V2.5系列API全球同步永久降价。相比原始定价，新定价最高降幅可达99%，且不再区分上下文窗口长度——这意味着无论用户输入多长的文本，都享受统一低价。同时，小米优化了TokenPlan计费体系，同等价格下，用户可获得的Token用量提升至原来的5-8倍。

小米此次降价的激进程度远超预期。此前，DeepSeek在4月底已将V4-Pro缓存输入价格降至0.025元/百万tokens，创下全球最低。如今小米直接将API价格拉低99%，相当于在DeepSeek的底价上又砍了一刀。小米官方并未直接提及DeepSeek，但业内人士指出，小米的定价策略完全对标DeepSeek的“缓存命中”场景，意图抢夺开发者生态。

更值得注意的是，小米强调降价是“永久”的，而非限时折扣。这与DeepSeek先限时折扣后转为长期降价的套路如出一辙。小米选择在DeepSeek降价一个月后跟进，既避开了初期服务器冲击，又借势坐实了“价格战参与者”的身份。

DeepSeek的“价格核弹”如何炸开AI市场？

时间拨回到4月25日，DeepSeek-V4-Pro开启限时2.5折优惠，输入价格（缓存命中）降至0.25元/百万tokens。叠加优惠后，V4-Pro低至0.025元/百万tokens，V4-Flash仅0.02元/百万tokens。相比之下，OpenAI的GPT-5.5缓存输入价格约3.4元，DeepSeek仅为对手的1/32，甚至不到3%。媒体形容“比美国便宜97%”。

小米跟了DeepSeek价格战！直降99%，全面对标

这个价格有多夸张？上海译文出版的《挪威的森林》全书约20万字，喂给DeepSeek-V4-Pro的成本不到1分钱。DeepSeek研究员陈德里确认，输入缓存降价为永久策略，且打上了“AGI for Everyone”的标签。其背后的商业逻辑是：先用低价打穿RAG知识库、智能客服、文档分析等缓存命中率高的场景，再通过云服务和私有化部署盈利。

价格战迅速拉动需求。根据OpenRouter报告，4月25日DeepSeek-V4-Pro日调用量达136亿Token，较前一日增长近四倍。而小米的跟进，无疑会进一步挤压OpenAI、谷歌等海外巨头的市场空间。

价格战背后的算力博弈：国产芯片成本优势凸显

降价不是凭空喊话，而是建立在成本结构优化之上。DeepSeek之所以能打出“全球最低价”，一个重要原因是其大规模使用了国产芯片。华为昇腾910C单颗BF16性能虽仅为英伟达Blackwell的三分之一，但通过CloudMatrix超节点集群，384集群的BF16总性能反而是NVL72的1.7倍，内存容量是其3.6倍，带宽是其2.1倍。关键是成本：昇腾950PR定价约7万元，英伟达H200约25万元，同算力下昇腾方案比英伟达H20方案节省60%-70%。

小米此次降价能否持续，同样取决于其算力基建。小米虽然未公开自研芯片细节，但其MiMo大模型与小米澎湃OS深度绑定，智能家居、IoT设备对推理需求巨大。小米更有可能采用“混合部署”策略：高端场景用英伟达，大规模推理靠国产芯片。梁文锋曾表示：“AI就是基础设施，和柴米油盐一样，价格战不可避免，最终走向规模经济+薄利多销。”小米的IoT生态正是这种逻辑的最佳试验田。

生态战而非价格战：两种路径的殊死较量

参考资料指出：“一旦‘一次通过率’接近99%，就完全进入另一个维度。小米目前领先的是过程流畅，DeepSeek赌的是最终交付的可靠性。”这句话点出了两家公司的本质差异：小米依靠澎湃OS和米家生态，强调“过程流畅”——从手机到汽车、家电，用户的每一次AI交互都不应有卡顿；DeepSeek则追求模型本身的“最终交付可靠性”，即代码生成、知识问答的准确度。

小米降价不是为了抢占AI开发者市场（那是DeepSeek的主场），而是为了将AI能力植入自家产品的每一个角落。当MiMo-V2.5的API价格降至几乎免费，第三方开发者就能低成本接入小米生态，例如开发智能家居的语音控制、汽车座舱的实时问答。这种“生态战”比单纯的价格战更难复制：用户一旦习惯了小米的AI全家桶，就很难迁移。

反观DeepSeek，其策略是先用价格打穿市场，再用开源建立生态，最后通过企业服务（私有化部署、安全合规）承接价值。梁文锋曾在2024年表示：“我们的原则是不贴钱，也不赚取暴利。降价是因为我们探索下一代模型结构时成本先降下来了。”这种“技术驱动+规模效应”的逻辑，与小米的“场景驱动+生态绑定”形成了鲜明对比。

AI普惠的终局：从API降价到规模经济

4月26日，小米降价公告发布后，AI算力芯片板块应声上涨，海光信息涨幅8.2%，天数智芯港股涨9.54%。市场看到的是，不仅DeepSeek在大规模使用国产芯片，小米也有望跟进，这将彻底激活国产算力产业链。根据测算，在100卡集群下，华为昇腾方案的总成本比英伟达H20低60%-70%，且单位算力功耗低65%。

但真正的瓶颈在软件生态。模型能否稳定跑在昇腾上？推理框架是否适配？算子有无优化？开发者迁移成本多高？这决定了降价能否转化为实际调用量。梁文锋坚信，AI普惠才能激发出足够大的应用市场，而应用市场越大，技术迭代的飞轮才能转起来。

小米和DeepSeek选择了不同的路径，但殊途同归：它们都在重塑开发者与用户对“合理价格”的认知。就像当年小米手机对智能手机市场的冲击一样，不是革命，却改变了所有人的预期。API降价只是第一层，接下来的生态共建、企业部署、算力适配，才是这场价格战的最终战场。

小米跟了DeepSeek价格战！直降99%，全面对标

小米MiMo-V2.5直降99%：一场蓄谋已久的跟进

DeepSeek的“价格核弹”如何炸开AI市场？

价格战背后的算力博弈：国产芯片成本优势凸显

生态战而非价格战：两种路径的殊死较量

AI普惠的终局：从API降价到规模经济

链接失效反馈