Deepseek 能否为中国节省 1 万亿美元?

架构革命:KV缓存压缩90%背后的黑科技

DeepSeek的省钱秘诀根植于其自研的层层技术突破。从2024年5月的DeepSeek V2引入专家混合模型(MoE)与多头潜在注意力(MLA)开始,训练高智能模型所需计算量降低40%至50%,KV缓存占用锐减90%。随后,DeepSeek V3.2 Exp的DSA技术进一步优化,到了2025年4月的DeepSeek V4,新增的CSA与HSA压缩注意力机制将KV需求再次降低90%,使得一个1.6万亿参数模型在长上下文任务中,HBM(高带宽内存)占用仅需5.48GB。这一成果直接颠覆了传统推理成本模型:KV缓存被压缩到可轻松卸载至SSD甚至NAND闪存,极大地缓解了中国在HBM这一最紧缺、最难制造的内存上的依赖。

Deepseek 能否为中国节省 1 万亿美元?

以软件代偿硬件:把“缺芯”变成系统优势

在美国出口管制导致高端GPU和HBM受限的背景下,DeepSeek的“算法代偿”策略堪称中国AI产业的破局点。通过将KV缓存卸载到更便宜、供应充足的NAND SSD或LPDDR内存,DeepSeek不仅降低了HBM需求,还通过Dual Path等技术实现了从SSD快速加载缓存,避免了昂贵的重新计算。这一权衡直接利好国产存储厂商:长江存储(YMTC)和长鑫存储(CXMT)的NAND、SSD和LPDDR用量因DeepSeek架构而大幅提升。同时,计算压力的减轻也给了国产GPU/ASIC芯片(如华为昇腾950PR)更多发展空间——DeepSeek V4已率先完成对国产芯片的适配验证,将“独立+开源+国产算力适配”这条路径彻底打通。

估值与战略:一万亿市值的“定义权”博弈

资本市场对DeepSeek的定价逻辑已超越传统财务指标。据《金融时报》披露,DeepSeek新一轮融资估值锁定450亿美元(约3065亿元),与智谱、MiniMax、月之暗面并称“中国AI四小龙”,合计估值突破一万亿元人民币。主流投资人认可其“定义者”地位:它不仅在基准测试上比肩OpenAI,更通过开源生态和国产算力构建了中国AI基础设施的另一种标准。国家大基金首次直接出手领投AI模型公司,将DeepSeek提升到与芯片制造同等级的战略层面。麦肯锡2026年《计算的成本》报告甚至推测,DeepSeek通过压低全行业的推理和训练成本,可能为中国AI基础设施建设节省高达1万亿美元——这相当于为整个产业端掉了一个巨大的成本包袱。

前路挑战:护城河与人才流失的风险

尽管前景诱人,DeepSeek并非高枕无忧。其估值优势高度依赖模型迭代速度和国产芯片兼容性的持续领先。阿里、华为等大厂同样在推进自己的架构优化,竞争压力不容小觑。更紧迫的是人才流失:过去一年,包括R1核心研究员在内多位关键成员被大厂以千万年薪挖走。这直接推动了DeepSeek启动外部融资以坐实期权价值。此外,算法代偿终究有天花板——当模型能力持续提升,单一环节的深度优化可能迟早碰到物理极限。但至少在当下,DeepSeek的架构创新已经为中国AI产业在算力围堵中撕开了一道价值万亿美元的口子。