融了500亿,梁文锋开始大搞基建了

13 小时前
5 阅读

空行后的正文:

V4炸场后,梁文锋反手甩出500亿融资牌

2026年4月24日,DeepSeek用一份58页的技术报告发布了V4——万亿参数MoE架构,MIT协议全量开源,更关键的是,它从头到尾跑在华为昇腾上,彻底摆脱英伟达依赖。同一天,OpenAI发布了GPT-5.5,梁文锋选的日子不是巧合。V4打消了外界对DeepSeek技术掉队的质疑,但真正让市场震惊的是一个月后的事:DeepSeek启动首轮外部融资,目标直指500亿元人民币,创下中国AI公司有史以来最大单轮融资纪录。

消息一出,估值从最初的100亿美元一路飙升,短短21天内翻了三倍多,最终定格在450-515亿美元区间。而此前两年,梁文锋对所有找上门来的投资人——腾讯、阿里、市面几乎所有顶级风投——都说过同一句话:“VC的钱是负担。”他甚至一度拒绝接听投资人电话,称“道不同不相为谋”。

但V4让一切变了。资本市场看懂了一个事实:DeepSeek的价值不再只是一家模型公司,而是国产AI基础设施里最关键的验证节点。英伟达CEO黄仁勋评价:“一旦DeepSeek率先在华为平台上发布,对美国而言将是灾难性的结果。”这500亿,本质上是在给“算力自主”买保险。

人走了,期权没价,梁文锋不得不掏200亿稳军心

DeepSeek总共不到200人,核心研究团队100多人,基模架构团队只有小几十人。但2025年下半年至今,至少流失了5名核心研发成员:R1核心研究员郭达雅去了字节跳动Seed团队,传闻总包近亿元;V3核心贡献者罗福莉被雷军开出千万年薪挖到小米;第一代大语言模型核心作者王炳宣去了腾讯;多模态核心研究员阮翀加入自动驾驶公司元戎启行;OCR系列核心作者魏浩然也已离职。字节、腾讯、小米、阿里都成了DeepSeek人才的“明牌买家”。

融了500亿,梁文锋开始大搞基建了

问题根源不在薪酬——DeepSeek过去也出手阔绰,给博士开过260万、270万年包再往上加100万。真正致命的是:DeepSeek从未进行过外部融资,员工手里的期权没有市场化定价锚点。核心团队可以靠“做出世界级模型”的理想支撑一段时间,但当大厂给出确定现金和签字费时,期权价值不明就成了留不住人的硬伤。

梁文锋在内部明确表示:“我们不是因为缺钱才融资,而是需要一个明确的估值锚点,来兑现员工的期权价值。过去三年,大家跟着我一起打拼,付出了很多。我不能让大家的努力白费。”于是,他自己掏了200亿元,占募资总额的40%,几乎押上了个人大部分身家。业内解读为三层意思:

  • 用500亿这个数字给员工期权标上公允价值;
  • 自己all in,给团队上一道保险;
  • 保持控制权——通过股权调整,梁文锋持股增至84.29%,表决权100%,即使引入国家大基金,董事会席位也不被稀释。

从CUDA到昇腾,500亿要买下算力基建的入场券

DeepSeek早期靠“低成本高效率”出名——R1训练成本仅60万美元,性能接近OpenAI o1。但这条路线的边际成本正在急剧抬升:V4光是训练和部署总成本就高达10亿美元。而且为了摆脱对英伟达芯片的依赖,DeepSeek将模型从CUDA全面迁移至华为昇腾CANN架构,涉及200多个核心算子的重写和十万级测试用例的验证,工程量远超外界想象。

V4发布后,华为云迅速完成适配。这不仅是云服务支持,更是对国产AI算力系统的一次高强度验证。美国持续收紧先进AI芯片出口管制,限制A100、H100及降规版本对华销售,英伟达真正的护城河是GPU+CUDA+网络+开发者生态构成的整体系统。如果DeepSeek能在国产算力上跑通强模型,它就不再只是模型公司,而是国产AI基础设施的“验证器”。

融资文件显示,500亿元将重点投向三大方向:算力基础设施建设、新一代大模型迭代研发、核心员工激励。DeepSeek已在内蒙古乌兰察布、鄂尔多斯投入数亿建设自有算力集群。今年3月底,DeepSeek曾因海量GPU算力需求遭遇长达12小时的超长宕机,暴露了基础设施的短板。购买更多服务器、建设更强云服务与运维体系,成为必须。

大基金领投,腾讯跟投,阿里出局:梁文锋只要战略合伙人

这轮融资的阵容极具象征意义。国家人工智能产业投资基金(大基金)正在洽谈主导领投,这是大基金首次直投AI大模型公司。腾讯拟出资60亿元,约占2%股权。而阿里——此前曾以100亿美元估值试图入股10%——在本次谈判中陷入僵局,最终悬而未定。

原因在于底层逻辑的错位。阿里曾提出不仅要求相当股权比例,还试图在董事会嵌入战略决策权。腾讯也曾要求认购最多20%股份,但被DeepSeek一口回绝。梁文锋坚持一条底线:控制权是不可交易的信仰。他先用自己的200亿把股权结构锁死——4月27日完成股权调整,注册资本增至1500万,持股84.29%、表决权100%——再打开大门迎接战略投资者。国家大基金带来的不是单纯的钱,而是产业链整合能力、算力基础设施支持,以及战略层面的资源同盟。这种“大基金主导、多家巨头小额参与、梁文锋个人重注”的三层结构,既保障资金供给,又防止任何一方获得压倒性话语权。

从黑马到基建玩家,DeepSeek正经历实验室文化的成年礼

DeepSeek最迷人的地方曾经是“小而狠”:技术味浓、敢开源、低价API掀桌子。但如今它必须面对全球AI牌桌——对手是OpenAI、Google、Anthropic、Meta,以及它们背后的云、芯片、资本和客户网络。单靠技术好远远不够。

拿到500亿后,DeepSeek正在发生四个维度的转变:

  1. 人才激励体系重做:核心员工期权有了市场定价,可能出现更清晰的回购、兑现或追加授予机制。
  2. 算力投入系统化:从临时适配转向长期基础设施团队,与芯片、云、框架厂商形成紧密协作。
  3. 开源和商业化重新平衡:V4.1预计6月登场,重点强化多模态交互与MCP协议适配,从“秀肌肉”走向“能干活”的企业级战场。
  4. 从技术黑马变成基础设施级玩家:梁文锋以前最不愿意讲故事,现在不得不构建一个能锁住人才、估值、算力、产业资源的系统结构。

正如一位AI创业公司合伙人评价:“这轮融资本质上是一场OpenAI式的期权重估。”理想可以让人上车,但只有明确的价格才能让人长期坐稳。而梁文锋自己那200亿,就是最硬的底牌——他输得起,也一定会赢。