DeepSeek融资500亿:量化大佬梁文锋的反资本实验
从千亿量化到AGI孤勇者:梁文锋的“三不”铁律
1985年生于广东湛江的梁文锋,身上贴着两个标签:量化私募巨头幻方量化的掌舵人,以及中国最“反资本”的大模型创始人。2008年刚毕业时,他带着7人团队用机器学习模型做量化交易,三个月实现500%收益;2015年幻方量化成立后,凭借AI驱动策略迅速崛起,2021年资管规模突破千亿,2025年个人年收入超7亿美元。早在2020年,他就投入上亿元搭建“萤火一号”超算集群,搭载上千张GPU,随后又砸10亿升级“萤火二号”至万张A100——这些远见让DeepSeek的“不差钱”成为行业共识。
2023年4月,梁文锋成立DeepSeek,立下三条铁律:不融资、不上市、不商业化。当字节、阿里、智谱AI们疯狂烧钱铺规模时,DeepSeek靠着幻方量化“无限供血”闭门研发,不路演、不接商业订单。他公开说过:“资本会追求短期回报,商业化会妥协技术路线。”2025年1月,DeepSeek-R1仅用约600万美元训练成本比肩OpenAI o1,用29.4万美元的惊人数字颠覆行业认知——原来不靠资本也能做出世界一流模型。
核心研究员接连出走:DeepSeek的人才期权困局
“小团队、高密度”曾是DeepSeek的骄傲——团队不到200人,基模架构团队仅小几十人,但个个能打。然而当公司成为“明牌资产”后,挖角潮汹涌而至:V3模型核心贡献者罗福莉被雷军千万年薪挖到小米;R1核心研究员郭达雅加入字节跳动Seed团队,传闻总包近亿元;多模态核心人员阮翀、OCR核心魏浩然等也相继离职。过去被DeepSeek挖人的字节、腾讯,如今反向抄底。

更深层的问题在于:DeepSeek员工的期权是“中国AI圈最难估值的资产”——公司从未融资,没有公开估值,没有上市时间表。技术理想能驱动人上车,但只有明确的价格才能让人坐稳。一位顶尖猎头透露,DeepSeek曾用“直接加100万”来抢人,但大厂给出的却是确定现金+签字费。梁文锋在内部坦言:“大家跟着我打拼,不能让努力白费。”这轮融资的核心目标之一,就是给期权一个市场化定价锚点。
梁文锋自掏200亿:一场没有投票权的资本盛宴
2026年4月24日,DeepSeek发布V4模型,万亿参数MoE架构全量开源,且首次跑在华为昇腾上,实现“去英伟达化”。一个月后,融资传闻落地:募资500亿元,估值超500亿美元。最震撼的细节是梁文锋个人出资200亿,占融资额40%,成为最大出资方。腾讯出100亿、宁德时代50亿、京东网易各30亿,国家大基金等战略资本入局——但传统财务VC(红杉、高瓴)全部被拒之门外。
交易结构堪称“反资本教科书”:外部投资者不获得投票权,只享有优先财务信息;所有股权设置五年锁定期;团队要求穿透核查LP身份,剔除所有投机资本。梁文锋通过有限合伙架构持股约84%,拥有近100%表决权。这意味着资本可以进来分享收益,但不能干预技术路线、不能短期套利、不能改变控制权——他用自己的200亿买下了“主导话语权”。正如业内评论:“这不是融资,这是给资本上了一道枷锁。”
国产算力自主的“买保险”:V4之后的战略重估
500亿融资不是救命钱,而是战略锚点。V4发布前,市场对DeepSeek的估值仅100亿美元;V4跑通国产算力后,估值飙到515亿美元。英伟达CEO黄仁勋警告:“一旦DeepSeek率先在华为平台发布,对美国将是灾难性的。”这轮融资真正战场在于算力自主——DeepSeek要用算法效率弥补硬件短板,绕过英伟达CUDA生态,在受约束条件下把效率榨干。
算力、人才、商业化三座大山逼迫梁文锋改变:从租用算力转向自建智算中心,近期已招聘IDC设计工程师;从纯API收费转向“模型+工具+智能体”的企业级交付;从单一技术黑马转向平台型AI公司。宁德时代的入股更暗藏深意——AI的底层变量将是电力与能源调度能力。未来DeepSeek的挑战在于:如何在保持开源低价、技术理想的同时,用超500亿美元估值证明可持续的收入能力?梁文锋用200亿个人押注给出的答案是:我输得起,也一定会赢。