小米跟了DeepSeek价格战!直降99%,全面对标
在DeepSeek以“骨折价”重塑AI定价体系一个月后,小米于5月27日正式加入战局。旗下MiMo-V2.5系列API宣布永久降价,最高降幅99%,且不再区分上下文窗口长度,并优化TokenPlan计费体系,同等价格下用量提升5-8倍。这一举措被外界视为对DeepSeek价格战的直接回应,也意味着AI大模型市场正式进入“白菜价”时代。
小米MiMo-V2.5直降99%:一场蓄谋已久的跟进
5月27日0时,小米旗下MiMo大模型突然发布公告,宣布V2.5系列API全球同步永久降价。相比原始定价,新定价最高降幅可达99%,且不再区分上下文窗口长度——这意味着无论用户输入多长的文本,都享受统一低价。同时,小米优化了TokenPlan计费体系,同等价格下,用户可获得的Token用量提升至原来的5-8倍。
小米此次降价的激进程度远超预期。此前,DeepSeek在4月底已将V4-Pro缓存输入价格降至0.025元/百万tokens,创下全球最低。如今小米直接将API价格拉低99%,相当于在DeepSeek的底价上又砍了一刀。小米官方并未直接提及DeepSeek,但业内人士指出,小米的定价策略完全对标DeepSeek的“缓存命中”场景,意图抢夺开发者生态。
更值得注意的是,小米强调降价是“永久”的,而非限时折扣。这与DeepSeek先限时折扣后转为长期降价的套路如出一辙。小米选择在DeepSeek降价一个月后跟进,既避开了初期服务器冲击,又借势坐实了“价格战参与者”的身份。
DeepSeek的“价格核弹”如何炸开AI市场?
时间拨回到4月25日,DeepSeek-V4-Pro开启限时2.5折优惠,输入价格(缓存命中)降至0.25元/百万tokens。叠加优惠后,V4-Pro低至0.025元/百万tokens,V4-Flash仅0.02元/百万tokens。相比之下,OpenAI的GPT-5.5缓存输入价格约3.4元,DeepSeek仅为对手的1/32,甚至不到3%。媒体形容“比美国便宜97%”。

这个价格有多夸张?上海译文出版的《挪威的森林》全书约20万字,喂给DeepSeek-V4-Pro的成本不到1分钱。DeepSeek研究员陈德里确认,输入缓存降价为永久策略,且打上了“AGI for Everyone”的标签。其背后的商业逻辑是:先用低价打穿RAG知识库、智能客服、文档分析等缓存命中率高的场景,再通过云服务和私有化部署盈利。
价格战迅速拉动需求。根据OpenRouter报告,4月25日DeepSeek-V4-Pro日调用量达136亿Token,较前一日增长近四倍。而小米的跟进,无疑会进一步挤压OpenAI、谷歌等海外巨头的市场空间。
价格战背后的算力博弈:国产芯片成本优势凸显
降价不是凭空喊话,而是建立在成本结构优化之上。DeepSeek之所以能打出“全球最低价”,一个重要原因是其大规模使用了国产芯片。华为昇腾910C单颗BF16性能虽仅为英伟达Blackwell的三分之一,但通过CloudMatrix超节点集群,384集群的BF16总性能反而是NVL72的1.7倍,内存容量是其3.6倍,带宽是其2.1倍。关键是成本:昇腾950PR定价约7万元,英伟达H200约25万元,同算力下昇腾方案比英伟达H20方案节省60%-70%。
小米此次降价能否持续,同样取决于其算力基建。小米虽然未公开自研芯片细节,但其MiMo大模型与小米澎湃OS深度绑定,智能家居、IoT设备对推理需求巨大。小米更有可能采用“混合部署”策略:高端场景用英伟达,大规模推理靠国产芯片。梁文锋曾表示:“AI就是基础设施,和柴米油盐一样,价格战不可避免,最终走向规模经济+薄利多销。”小米的IoT生态正是这种逻辑的最佳试验田。
生态战而非价格战:两种路径的殊死较量
参考资料指出:“一旦‘一次通过率’接近99%,就完全进入另一个维度。小米目前领先的是过程流畅,DeepSeek赌的是最终交付的可靠性。”这句话点出了两家公司的本质差异:小米依靠澎湃OS和米家生态,强调“过程流畅”——从手机到汽车、家电,用户的每一次AI交互都不应有卡顿;DeepSeek则追求模型本身的“最终交付可靠性”,即代码生成、知识问答的准确度。
小米降价不是为了抢占AI开发者市场(那是DeepSeek的主场),而是为了将AI能力植入自家产品的每一个角落。当MiMo-V2.5的API价格降至几乎免费,第三方开发者就能低成本接入小米生态,例如开发智能家居的语音控制、汽车座舱的实时问答。这种“生态战”比单纯的价格战更难复制:用户一旦习惯了小米的AI全家桶,就很难迁移。
反观DeepSeek,其策略是先用价格打穿市场,再用开源建立生态,最后通过企业服务(私有化部署、安全合规)承接价值。梁文锋曾在2024年表示:“我们的原则是不贴钱,也不赚取暴利。降价是因为我们探索下一代模型结构时成本先降下来了。”这种“技术驱动+规模效应”的逻辑,与小米的“场景驱动+生态绑定”形成了鲜明对比。
AI普惠的终局:从API降价到规模经济
4月26日,小米降价公告发布后,AI算力芯片板块应声上涨,海光信息涨幅8.2%,天数智芯港股涨9.54%。市场看到的是,不仅DeepSeek在大规模使用国产芯片,小米也有望跟进,这将彻底激活国产算力产业链。根据测算,在100卡集群下,华为昇腾方案的总成本比英伟达H20低60%-70%,且单位算力功耗低65%。
但真正的瓶颈在软件生态。模型能否稳定跑在昇腾上?推理框架是否适配?算子有无优化?开发者迁移成本多高?这决定了降价能否转化为实际调用量。梁文锋坚信,AI普惠才能激发出足够大的应用市场,而应用市场越大,技术迭代的飞轮才能转起来。
小米和DeepSeek选择了不同的路径,但殊途同归:它们都在重塑开发者与用户对“合理价格”的认知。就像当年小米手机对智能手机市场的冲击一样,不是革命,却改变了所有人的预期。API降价只是第一层,接下来的生态共建、企业部署、算力适配,才是这场价格战的最终战场。