DeepSeek V4价格打骨折,宁王京东网易抢着入场,梁文锋:目标是AGI

百万Token只需一分钱:DeepSeek的价格核弹

4月25日,DeepSeek-V4-Pro开启限时2.5折优惠,输入价格(缓存命中)降至0.25元/百万tokens。叠加限时折扣后,V4-Pro的缓存输入低至0.025元/百万tokens,V4-Flash降至0.02元/百万tokens,创下全球大模型价格新低。以上海译文出版的《挪威的森林》为例,全书约20万字,将整本书命中缓存后喂给DeepSeek-V4-Pro,总成本不到1分钱。

这次降价并非单纯的促销,而是对“长文本、长代码、长知识库”等原本最烧钱的AI应用场景的彻底击穿。DeepSeek研究员陈德里在社交媒体上确认,输入缓存降价是永久性的,并打上了“AGI for Everyone”的标签。对于RAG知识库、智能客服、文档分析等缓存命中率超过60%的应用场景,成本可直接下降90%以上。梁文锋此前曾表示:“我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。我们降价是因为成本先降下来了,也觉得AI应该是普惠的、人人可以用得起的东西。”

巨头争相入场:200亿估值融资背后的算力与生态

就在价格战打响的同时,DeepSeek启动了首次外部融资。据知情人士透露,目标估值从100亿美元迅速抬升至200亿至300亿美元,腾讯、阿里等科技巨头正洽谈入局。梁文锋此前长期依靠量化基金幻方量化输血,甚至拒绝过腾讯和阿里的合作机会,担心外部投资者干预决策。但如今态度发生180度大转弯——首轮融资至少3亿美元,估值可能超过300亿美元。

这一转变背后是AI行业残酷的“军备竞赛”。OpenAI 2025年亏损80亿美元,2026年预计亏损250亿美元;Anthropic年化收入从2025年底的90亿美元暴涨至2026年4月的300亿美元,隐含估值已超1万亿美元。在国内,智谱AI在4个月内连续三次涨价,累计涨幅83%,Token调用量仍增长400%;字节跳动为抵御人才流失,为Seed团队大规模发放专项期权。DeepSeek若要持续研发与算力投入,必须拥抱资本市场。

国产芯片逆袭:昇腾950PR如何让成本再降七成

V4适配的华为昇腾950PR推理芯片于2026年3月量产,单卡算力较英伟达对华特供版H20提升2.87倍。更关键的是成本:昇腾950PR定价约7万元人民币,英伟达同级别H200约合25万元。按FP8精度算,昇腾950PR约7万元/PFLOPS,英伟达H200约6.31万元/PFLOPS;按推理专用FP4精度算,昇腾950PR为4.49万元/PFLOPS,英伟达B200为4.44万元/PFLOPS——差距微乎其微。

实际部署中,以100卡集群为例,英伟达H20方案总成本约1500万元,华为昇腾950PR方案约1000万元出头。而且1张昇腾950PR的推理吞吐量约等于2.2-2.8张H20,使得昇腾方案整体节省60%到70%的成本。V4发布当天,华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯8家国产AI芯片品牌完成适配,AI算力芯片板块股价大涨。梁文锋选择这条高风险高收益的路——从CUDA转向华为CANN框架,虽然工具链尚不成熟,但在推理侧、缓存场景、长文本应用里,国产芯片的性价比优势正在释放。

从价格战到生态战:梁文锋的AGI野望与商业化平衡

梁文锋已向潜在投资者明确表示,公司将继续优先推进突破性人工智能研究,追求通用人工智能(AGI),而非短期商业化变现。V4将参数推至1.6万亿,首次将百万token上下文打成标配,且百万上下文下每token算力消耗仅为V3.2的27%,KV缓存占用只有10%。内部评测显示,其交付质量已接近Claude Opus 4.6的非思考模式。

但DeepSeek也面临新挑战。V4仅支持文字输入,暂不支持原生多模态,而Gemini 3.1 Pro、GPT-5.4已实现“全模态”。核心人才流失也在加剧:R1核心研究员、DeepSeek-Coder系列第一作者郭达雅等多名员工先后加入字节、腾讯、小米。梁文锋的解法是构建生态壁垒:先用价格打穿市场,再用开源建立开发者社区,最终通过企业级部署、私有化部署、云厂商合作和服务增值来承接价值。在他看来,只有让AI真正普惠,才能激发出足够大的应用市场,让技术迭代的飞轮转起来。