刚刚,Cursor被扒底裤,Claude Code套壳实锤,500亿估值全靠Ctrl+H?


几天前,Cursor发布了号称“自研”的Composer 2模型,这款模型在性能上大幅超越Claude Opus 4.6和GPT-5.4,甚至在多个基准测试中拿下领先成绩。然而,这场看似辉煌的技术发布会,很快演变成一场“翻车现场”。开发者在拆解模型后发现,其底层竟然调用了中国开源模型Kimi K2.5。这一发现不仅动摇了Cursor“自研”的叙事,也引发了一场关于AI行业伦理和开源许可合规性的激烈讨论。


事件背景:估值500亿美元的AI编程独角兽

Cursor是硅谷近年来最炙手可热的AI编程助手之一,凭借其智能化的代码补全和协作功能迅速崛起。2026年3月,其估值已逼近500亿美元,正在寻求新一轮融资以进一步扩张。Composer 2的发布被看作是Cursor巩固行业地位的重要一步。然而,随着技术细节被公开,争议也迅速浮出水面。


套壳真相:Composer 2实为Kimi K2.5强化版

据开发者揭露,Cursor Composer 2的模型ID中出现了“kimi-k2p5-rl-0317-s515-fast”字样,这与Kimi K2.5的模型路径高度吻合。随后,Kimi预训练负责人也在推特上证实,该模型的分词器与Kimi完全一致,并质问Cursor是否违反了MIT License协议。

  • MIT License规定:若基于Kimi的衍生产品月收入超过2000万美元,必须在显著位置标注“Kimi K2.5”。
  • Cursor年收入超过20亿美元,月收入约为1.66亿美元,早已触发署名义务。

更令人震惊的是,早在2025年10月Composer 1发布时,就有用户反馈模型在思考过程中“蹦出中文”,这已间接揭示其可能依赖中文大模型。但当时Cursor选择冷处理,未予回应。


刚刚,Cursor被扒底裤,Claude Code套壳实锤,500亿估值全靠Ctrl+H?

技术真相与马斯克下场

Cursor在后续回应中承认,Kimi K2.5在基座模型的评估中表现最强,并成为Composer 2的起点。他们强调Composer 2的强化学习、compaction-in-the-loop等训练技术确实投入巨大,算力消耗中只有约1/4来自Kimi,其余均为自身训练成果。

  • 性能对比
    • 在CursorBench上,Composer 2得分61.3,对比Composer 1.5的44.2,提升近40%。
    • 在Terminal-Bench 2.0中,Composer 2得分为61.7,领先Claude Opus 4.6(58.0)和GPT-5.4。

马斯克在推特上直接回应开发者质疑,调侃“Yeah, it's Kimi 2.5”,并转发相关技术讨论。这一行为迅速引爆社区,引发包括Andrej Karpathy、Jerry Tworek等行业大咖的参与。


中国开源模型上大分:Kimi的逆袭与技术优势

Kimi K2.5作为万亿参数的MoE模型,推理时仅激活320亿参数,实现了“高性能低消耗”的平衡。其三模态输入能力(文本、图像、视频)在前端开发场景中尤为突出,甚至能根据UI设计稿直接输出带交互动效的前端代码。

此外,Kimi还引入了Agent Swarm机制,可同时调度100个子Agent执行任务,完成高达1500次工具调用,任务执行速度提升了4.5倍。

  • 性能指标
    • 在Humanity's Last Exam得分50.2,领先GPT-5.2(45.5)和Claude Opus 4.5(43.2)。
    • 在BrowseComp得分74.9,远超GPT-5.2的65.8。

Cloudflare也将Kimi K2.5纳入Workers AI平台,其安全审计Agent每天处理超过70亿智元(token),年成本相比其他模型降低77%。


Cursor的定价策略与技术创新

Composer 2在价格上也引发关注:

  • 标准版定价:每百万输入智元0.5美元,输出2.5美元,相比Composer 1.5降价86%。
  • Fast版定价:1.5/7.5美元,比1.5版便宜57%。

这些降价的背后,是Cursor在训练阶段采用了“compaction-in-the-loop强化学习”技术:

  • 当生成过程触发token长度阈值时,模型自动暂停并压缩上下文。
  • 从5000+ token压缩到约1000 token,上下文遗忘率降低50%,token效率提升5倍。

此外,Composer 2还集成了Cursor的Agent工具链,包括语义代码搜索、文件检索、shell命令执行、浏览器控制等,使其不仅是一个回答问题的模型,而是一个能在IDE中“动手干活”的智能Agent。


行业影响:技术、伦理与商业模式的三重冲击

此次事件对AI行业的冲击是多方面的:

  1. 技术认知冲击

    • Kimi K2.5的性能超越GPT和Claude,证明中国开源模型已具备国际竞争力。
    • 套用开源模型进行商业化并非罕见,但“伪装成自研”却引发伦理争议。
  2. 商业模式冲击

    • 有网友预测:未来开源模型实验室将通过授权分成盈利,形成技术与商业的“飞轮”。
    • Kimi虽未收费,但通过品牌曝光和许可条款维护了自身价值。
  3. 合规与品牌信任冲击

    • Cursor在最初否认使用Kimi,后被迫承认,暴露出品牌叙事与实际技术之间的鸿沟。
    • 社区开始更加关注模型的底层来源和许可协议,推动行业透明化。

总结:一场“Ctrl+H”引发的信任危机

这次“扒底裤”事件不仅揭开了Cursor“自研”神话的面纱,也反映了AI模型商业化中的深层问题。在一个以创新为核心价值的行业,如果“自研”可以靠Ctrl+H(替换)实现,那么信任与公平的边界又在哪里?Kimi K2.5的技术实力和开源精神正在赢得更多尊重,而Cursor则面临着品牌信任的严重危机。