小米跟了DeepSeek价格战,直降99%,全面对标
小米MiMo大模型API永久降价99%
5月27日,小米旗下MiMo大模型发布公告,对V2.5系列模型API进行永久性降价,最高降幅达99%,不再区分上下文窗口长度。同时优化Token Plan计费体系,同等价格下用量提升至原来的5-8倍。这一动作直接对标DeepSeek此前掀起的“价格战”,将大模型API价格推至新低。小米此举不仅降低了开发者调用成本,更是在AI基础设施层面全面对标行业新标杆,试图通过“堆量降价”抢占市场份额。

DeepSeek价格战:把token价格打骨折
DeepSeek-V4-Pro于4月25日开启限时2.5折优惠,缓存命中输入降至0.25元/百万tokens,叠加折扣后低至0.025元/百万tokens,创下全球大模型价格新低。以20万字《挪威的森林》为例,整本缓存命中成本不到1分钱。DeepSeek不仅降低了单价,更将长文本、长代码、长知识库等“烧钱”场景打入价格谷底。其研究员陈德里确认输入缓存降价为永久性,并打上“AGI for Everyone”标签。这一策略旨在通过低价重构行业定价体系,让开发者意识到“还有这么便宜的选择”。
国产算力成本优势:昇腾方案省60%-70%
DeepSeek大规模使用国产芯片,带动产业链激活。华为昇腾950PR定价约7万元,远低于英伟达H200的25万元。按推理专用的FP4精度计算,昇腾950PR为4.49万元/PFLOPS,英伟达B200为4.44万元/PFLOPS,性能接近但成本更低。以100卡集群为例,英伟达H20方案总价近1500万元,而昇腾950PR方案仅1000万出头,且昇腾单卡推理吞吐量约等于2.2-2.8张H20,总体节省60%-70%。DeepSeek-V4发布当天,华为昇腾、寒武纪等8家国产AI芯片品牌完成适配,A股海光信息涨8.2%、寒武纪涨2.23%,港股天数智芯涨9.54%。
价格战背后的商业逻辑:薄利多销与生态变现
梁文锋曾表示,AI应像基础设施一样普惠,ARM原则是不贴钱也不赚暴利。他认为只有让AI价格足够低,才能激发应用市场,驱动技术迭代飞轮。然而,API收入只是第一层,更深层次的商业模式在于模型标准、开发者生态、企业部署、算力适配和云厂商合作。对于金融、政务等对数据安全敏感的行业,DeepSeek可通过开源模型作为入口,提供私有化部署、调优、运维等收费服务。阿里云、智谱AI等厂商则采取不同策略:阿里云一边涨算力卡和存储,一边代理DeepSeek以捆绑云服务;智谱AI则连续三次涨价,用高定价筛选高价值客户,其API年化收入暴涨60倍至17亿元。小米此次跟价,意味着其也将依靠规模效应和生态协同,在薄利多销中寻找盈利空间。