马斯克买壳,梁文锋筑墙:AI 原生公司的生存法则

Cursor的600亿收编:独立应用层的天花板

当Cursor被SpaceX以600亿美元估值全股票收购时,市场一度将其捧为技术明星。然而剥开外壳,这桩交易更像是一场资本杠杆包装下的故事。Cursor并非基础模型公司,其核心推理能力高度依赖Anthropic、OpenAI等上游厂商,缺乏底层大模型底座。这意味着即便有自研专用小模型和工程优化层,它的长期独立性也面临结构性挑战——代码补全、智能调试等功能,终究是在别人地基上盖房子。这次收购采用全股票支付,SpaceX几乎不动用现金,只用IPO后的高估值股权置换了一个市场热度拉满的AI资产。对Cursor原投资方而言,这无疑是赛道泡沫期的最优退出路径。但正如分析师所指出的,这类工具的天花板早已注定:AI编程IDE、办公类AI等应用层产品,做大后被收购是商业规律,而主动放弃自主权换取短期回报,正是其宿命。

DeepSeek的500亿融资:用股权结构为自主权筑墙

与Cursor形成鲜明对比的是DeepSeek。当外界看到500亿元人民币的融资规模时,第一反应是“烧钱竞赛”。但如果把标尺换成独立性存亡,结论截然不同:这笔钱根本不是“卖身”,而是买门票。梁文锋本人自掏200亿元领投,占本轮融资总额的40%,并通过直接与间接持股控制了公司约84.29%的股权和100%的表决权。这种治理结构设计的核心逻辑是:引入资本,但绝不让资本成为公司的主人。国家集成电路产业投资基金、宁德时代等战略投资者入局,本质上不是财务投资。宁德时代意味着DeepSeek提前锁定了未来AI数据中心储能订单,为更大规模的算力基建埋下伏笔。京东、网易等互联网大厂则各有战略诉求。梁文锋用LP结构和控股权,换取了技术自由——可以坚持开源普惠路线,能以低价策略冲击市场,而不必被短期盈利压力绑架。

硬件生态重构:十万亿美元棋盘中不赚快钱的逻辑

DeepSeek真正的生存法则不仅在于股权结构,更在于技术创新路径。在所有人堆Dense模型、卷参数时,DeepSeek选择了最难啃的MoE架构。其独创的MLA、DSA等结构将KV Cache压缩到极致:1.6万亿参数的V4模型,KV Cache仅需5.48GB HBM,不到同级模型的零头。这使得V4-Pro的API定价可以永久降至对手的3%以下,且持续缓存数小时。这种技术底蕴指向更大的棋盘:将KV Cache卸载到SSD,用LPDDR内存作为权重暂存区,用Engram模块中的哈希查表替代Transformer前向计算——本质上是用更便宜的“内存读取”替代昂贵的“GPU运算”。当国产GPU因EUV受限在原始FLOPs落后时,这种“换道超车”为国产芯片厂商提供了生态突破的可能。再加上投资的跨硬件内核编译框架TileLang,DeepSeek正在让中国现有的存储、芯片、网络生态变得足够用、甚至好用。

终极生存法则:模型底座决定谁活得久、谁走得远

两个数字,两种走向:Cursor 600亿卖身,DeepSeek 500亿融资。量级相近,路径相反。一个是被动的价值变现,放弃长期自主权;一个是主动的规则设计,把资本变成长跑燃料。AI独立公司的生死线早已不再是用户规模或短期估值,而是是否拥有定义未来的模型底座。DeepSeek不做多模态、不做语音模型、API一再降价——所有这些“不做”都指向同一个目标:通过技术创新大幅压低对顶级硬件的依赖,从而以更低的成本启动大规模强化学习和递归自我改进训练。从MoE到MLA,从DSA到Engram,从KV Cache压缩到TileLang,所有创新最终汇聚到一点:让AGI训练从“烧不起”变成“烧得起”。马斯克用SpaceX股票买Cursor,是在用资本杠杆包装AI故事;梁文锋用LP结构拿腾讯和宁德时代的钱,是在用治理结构换取技术自由。比拼谁更贵的时代结束了,谁活得更久、更独立,才是AI创业走向成熟的唯一标志。