DeepSeek V4价格打骨折，宁王京东网易抢着入场，梁文锋：目标是AGI

1 个月前

AI资讯

59 阅读

大模型 DeepSeek AGI 价格战

百万Token只需一分钱：DeepSeek的价格核弹

4月25日，DeepSeek-V4-Pro开启限时2.5折优惠，输入价格（缓存命中）降至0.25元/百万tokens。叠加限时折扣后，V4-Pro的缓存输入低至0.025元/百万tokens，V4-Flash降至0.02元/百万tokens，创下全球大模型价格新低。以上海译文出版的《挪威的森林》为例，全书约20万字，将整本书命中缓存后喂给DeepSeek-V4-Pro，总成本不到1分钱。

这次降价并非单纯的促销，而是对“长文本、长代码、长知识库”等原本最烧钱的AI应用场景的彻底击穿。DeepSeek研究员陈德里在社交媒体上确认，输入缓存降价是永久性的，并打上了“AGI for Everyone”的标签。对于RAG知识库、智能客服、文档分析等缓存命中率超过60%的应用场景，成本可直接下降90%以上。梁文锋此前曾表示：“我们的原则是不贴钱，也不赚取暴利。这个价格也是在成本之上稍微有点利润。我们降价是因为成本先降下来了，也觉得AI应该是普惠的、人人可以用得起的东西。”

巨头争相入场：200亿估值融资背后的算力与生态

就在价格战打响的同时，DeepSeek启动了首次外部融资。据知情人士透露，目标估值从100亿美元迅速抬升至200亿至300亿美元，腾讯、阿里等科技巨头正洽谈入局。梁文锋此前长期依靠量化基金幻方量化输血，甚至拒绝过腾讯和阿里的合作机会，担心外部投资者干预决策。但如今态度发生180度大转弯——首轮融资至少3亿美元，估值可能超过300亿美元。

这一转变背后是AI行业残酷的“军备竞赛”。OpenAI 2025年亏损80亿美元，2026年预计亏损250亿美元；Anthropic年化收入从2025年底的90亿美元暴涨至2026年4月的300亿美元，隐含估值已超1万亿美元。在国内，智谱AI在4个月内连续三次涨价，累计涨幅83%，Token调用量仍增长400%；字节跳动为抵御人才流失，为Seed团队大规模发放专项期权。DeepSeek若要持续研发与算力投入，必须拥抱资本市场。

国产芯片逆袭：昇腾950PR如何让成本再降七成

V4适配的华为昇腾950PR推理芯片于2026年3月量产，单卡算力较英伟达对华特供版H20提升2.87倍。更关键的是成本：昇腾950PR定价约7万元人民币，英伟达同级别H200约合25万元。按FP8精度算，昇腾950PR约7万元/PFLOPS，英伟达H200约6.31万元/PFLOPS；按推理专用FP4精度算，昇腾950PR为4.49万元/PFLOPS，英伟达B200为4.44万元/PFLOPS——差距微乎其微。

实际部署中，以100卡集群为例，英伟达H20方案总成本约1500万元，华为昇腾950PR方案约1000万元出头。而且1张昇腾950PR的推理吞吐量约等于2.2-2.8张H20，使得昇腾方案整体节省60%到70%的成本。V4发布当天，华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯8家国产AI芯片品牌完成适配，AI算力芯片板块股价大涨。梁文锋选择这条高风险高收益的路——从CUDA转向华为CANN框架，虽然工具链尚不成熟，但在推理侧、缓存场景、长文本应用里，国产芯片的性价比优势正在释放。

从价格战到生态战：梁文锋的AGI野望与商业化平衡

梁文锋已向潜在投资者明确表示，公司将继续优先推进突破性人工智能研究，追求通用人工智能（AGI），而非短期商业化变现。V4将参数推至1.6万亿，首次将百万token上下文打成标配，且百万上下文下每token算力消耗仅为V3.2的27%，KV缓存占用只有10%。内部评测显示，其交付质量已接近Claude Opus 4.6的非思考模式。

但DeepSeek也面临新挑战。V4仅支持文字输入，暂不支持原生多模态，而Gemini 3.1 Pro、GPT-5.4已实现“全模态”。核心人才流失也在加剧：R1核心研究员、DeepSeek-Coder系列第一作者郭达雅等多名员工先后加入字节、腾讯、小米。梁文锋的解法是构建生态壁垒：先用价格打穿市场，再用开源建立开发者社区，最终通过企业级部署、私有化部署、云厂商合作和服务增值来承接价值。在他看来，只有让AI真正普惠，才能激发出足够大的应用市场，让技术迭代的飞轮转起来。

DeepSeek V4价格打骨折，宁王京东网易抢着入场，梁文锋：目标是AGI

百万Token只需一分钱：DeepSeek的价格核弹

巨头争相入场：200亿估值融资背后的算力与生态

国产芯片逆袭：昇腾950PR如何让成本再降七成

从价格战到生态战：梁文锋的AGI野望与商业化平衡

链接失效反馈