DeepSeek永久降价,第一个赢家已经浮出水面
永久2.5折背后的底线承诺
5月22日,DeepSeek官方宣布了人工智能行业迄今最激进的一项定价策略:原本在5月底到期的V4-Pro模型2.5折限时优惠将永久延续,API价格从此锁定在每百万token0.025元至6元的区间,仅为原定价的四分之一。这一消息迅速在开发者社区引爆——“Token自由了”成了当天的热门标签。
此次降价并非单纯的促销手段,而是对行业可持续商业逻辑的一次颠覆。创始人梁文锋同期向投资人明确表态:“不做变现机器,要做AGI。”他的战略逻辑在于,廉价算力是通往通用人工智能的必经之路,而非利润收割的前奏。在已经推进的700亿元人民币融资中,宁德时代、腾讯、国家人工智能产业投资基金等重量级投资方赫然在列,资本对这条“烧钱换未来”的路线的认可度可见一斑。
《证券时报》评论指出,此举可能重燃AI行业的价格战。去年DeepSeek凭借R1模型颠覆格局时,曾掀起过一轮激烈的价格竞争。如今V4-Pro的永久降价,相当于把物理学家杰文斯160年前观察到的规律重演一遍——效率提升不会减少资源消耗,反而会刺激更大需求。清华大学《Token经济学全景报告》的数据印证了这一点:过去三年模型推理成本下降了280倍,但企业的AI总支出反而增长了2.4倍。
开发者率先实现“Token自由”
价格战的硝烟弥漫到开发者端时,力量正以惊人的速率转化。数据显示,在DeepSeek宣布降价的第二天,V4-Flash模型的调用量瞬间飙升至814亿Token,较前一日环比增长62.2%;V4-Pro的调用量也达到96亿Token。按照新价格计算,一个中型应用团队每月在API上的支出可能从数万元降至数千元级别。
这一价格体系在中国大模型市场中已形成碾压优势。国内同级别产品的输入缓存命中价格普遍在每百万token0.1元以上,而V4-Flash的同类收费仅为0.02元,V4-Pro为0.025元。即便与OpenAI或Anthropic的闭源模型相比,DeepSeek也把成本压缩到了“御三家”价格的5%左右。
更为关键的是,降价并未以牺牲性能为代价。DeepSeek-V4模型具备处理超长上下文——百万字的能力,在智能体能力、世界知识和推理性能方面均处于国内与开源领域的领先地位。在Agentic Coding评测中,V4-Pro已成为开源模型中的最佳选择,并在内部使用体验上优于Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式。这意味着开发者拥有了“低价+高性能”的双重竞争力。
一位开发者向技术社区透露:“以前算账会很纠结:是否要为了吊打效果而接受高额令牌费用?现在不存在这种权衡了。用V4搞AI Agent的研发和部署,任务的成功率和成本几乎是正相关的。”
国产算力生态迎来最强背书
在价格与性能的双重攻势背后,DeepSeek V4最被低估的战略棋子其实是一套算力底层的“脱美入华”。此次发布的V4模型全面迁移至华为昇腾CANN生态,能够完全运行在昇腾950PR芯片上。这一突破,被分析师称为“拥抱国产算力”的里程碑。
长期以来,华为昇腾的生态推广陷入一个死结:没有顶级模型愿意做首个迁移者,因为迁移成本高风险极大;但若没有顶级模型背书,下游云厂商和企业客户就不敢大规模采购昇腾。V4的发布直接切断这个死结。据业界调研,阿里、字节、腾讯已开始大批量采购昇腾950PR,三大厂商合计采购量超46万颗,占昇腾950PR全年预计出货量的60%以上。
这一数据背后隐藏的逻辑是:昇腾950PR未必比英伟达H100更强,但被DeepSeek证明了“够用”。“够用”二字在产业链里价值连城——它意味着中国AI企业可以从对英伟达高端GPU的依赖中松绑,转而去铺设一条自主可控的算力轨道。
技术层面,V4对国产芯片的适配并非简单移植,而是进行了从架构到优化的深度协同。其首创的CSA+HCA混合注意力机制,通过双重压缩将长上下文计算量降低73%、显存占用减少90%;Muon优化器的全面切换,则在训练效率和收敛稳定性上实现代际跃升。这些底层创新使其在昇腾芯片上跑出了不逊于英伟达平台的性能表现。《澎湃新闻》分析指出,DeepSeek之所以能掌握成本控制主动权,原因之一正是“拥抱国产算力”。
Agent时代的价格门槛被彻底击穿
当大多数市场目光仍然聚焦在Chatbot级别的自然语言对话时,AI竞争的生存游戏正在向Agent维度切换——在这种新范式下,成本、稳定性和对高频调用的支持程度,首次跑到了模型质量前面。
Anthropic的现状凸显出这个趋势的残酷性。2026年,该公司仅推理成本就将达到141亿美元,CEO Dario Amodei在播客中坦言:“如果我的收入无法达到1万亿美元,一旦买下那么多的算力,地球上没有任何力量能阻止我破产。”为应对这种疯狂的成本压力,Anthropic开始封杀个人订阅用户通过OAuth令牌将Claude接入第三方工具的行为——订阅制定价根本无法在Agent时代维持盈利。
而DeepSeek V4恰好瞄准了这个空白地带。在最新模型的定位中,DeepSeek明确将自身定义为“Agent基础设施”,针对Claude Code、OpenClaw、CodeBuddy等主流Agent框架做了专项优化。在多Agent并发场景下,V4支持23个Agent同时稳定运行,且不限流。这意味着一个团队可以用几台低配服务器加一个小型API预算,就搭建起一套企业级AI自动化流水线。
《2026 Agentic Coding Trends Report》的数据也为DeepSeek的降价策略提供了合理性背书。报告将Agent任务分为三层:底层高频低风险任务(代码补全、单元测试生成等)占企业调用量的65%,此类任务DeepSeek V4与Claude Opus的最终产出几乎没有区别;中层中频任务占28%,这是降价后DeepSeek可以垂直杀入的优势地带。尽管顶层复杂任务仍有差距,但已经有开发者观察到了国产模型挤占顶尖闭源模型用户群的现象。
鲶鱼效应下的AI大航海时代
“DeepSeek不需要永远强,它只需证明这条路走得通。”这句评价精准描摹了V4在中国AI产业的生态位置。
在V4发布前,DeepSeek经历了整整15个月的“隐匿期”——从2025年1月R1爆红到2026年4月V4发布,期间核心团队持续流失,至少5名核心研发成员转投腾讯、字节跳动、自动驾驶公司元戎启行等机构。外界一度认为这家曾让硅谷侧目的公司将淡出第一梯队。但V4带着百万上下文、AI Agent能力和全栈国产算力适配重新杀回牌桌,这种“团队在散、技术在走”的反直觉增长轨迹,本身就是对中国AI产业生态韧性的一次终极检验。
这种鲶鱼效应正在扩散。Kimi K2.6,基于1万亿总参数、32B激活参数的MoE架构模型,在LiveCodeBench基准测试中拿下85%的高分,其架构思路很大程度上受到DeepSeek在MoE和推理优化方面的启发。月之暗面、智谱、MiniMax等本土模型厂商也在被迫加速技术迭代。整个国产模型生态的水位线,正在这一条条不安分的鲶鱼搅动下不断升高。
更为关键的是,V4验证了一条“开源模型+国产芯片”的新技术路径。大量中国产开源大模型奔跑在国产算力芯片上,为全球开发者提供了除美国闭源体系之外的另一个关键技术选项。即使未来DeepSeek掉出第一梯队,其技术路线、开源权重和人才储备已经被整个行业吸收。正如机构分析师所形容的:这不是一场马拉松,而是一场接力赛。V4跑了一棒,Kimi跑了第二棒,后面还有阿里、字节、甚至某个现在还没成立的小团队——每棒都可能摔倒,但只要下一棒有人接着跑,硅谷巨头的领先距离就会被不断压缩。
“开源模型+国产芯片”的组合,正在重塑全球AI价值链的地缘格局。DeepSeek的永久降价,正是这个AI大航海时代的第一个信号弹。