Meta亿元天团首个大模型交卷!余家辉宋飏Jason Wei耗时九个月,一雪Llama前耻
根据最新公开信息,由余家辉、宋飏和Jason Wei等顶尖AI科学家组成的Meta亿元天团,耗时九个月打造的全新大模型Muse Spark正式发布。这款模型不仅标志着Meta在AI大模型领域的强势回归,更被外界视为对Llama 4未能达到预期表现的一次“雪耻”。
背景与团队组成
-
顶尖阵容集结:
- Muse Spark项目由Meta重金打造,核心团队成员包括:
- 余家辉:前谷歌资深AI研究员,以高效推理和语言理解模型闻名。
- 宋飏:扩散模型领域的先锋,曾推动Meta在视觉生成方面取得突破。
- Jason Wei:思维链(Chain-of-Thought)技术提出者,现负责模型推理能力设计。
- Hyung Won Chung:OpenAI o1项目核心贡献者之一。
- 团队组建初期,就明确目标——打造一个真正能在推理、多模态、健康等复杂任务上“打硬仗”的模型。
-
对Llama 4的反思:
- Llama 4虽在开源社区获得高度关注,但其推理能力、效率优化等方面未能在第三方测评中跻身第一梯队。
- Muse Spark的研发正是在这一背景下启动,目标是“用闭源策略实现性能飞跃”。
Muse Spark的技术亮点
-
测试时推理能力强化:
- 模型在回答复杂问题前会进行“思维压缩”,通过强化学习机制学会在有限token中完成高质量推理。
- 在多个需要深度思考的任务中,表现优于GPT-5.4和Gemini 3.1 Pro的某些版本。
-
多模态感知与推理:
- Muse Spark在图像、文本、语音等多模态任务上展现出强大能力。
- 例如在医学问答系统MedXpertQA MM中,其表现位居前列,尤其在开放式健康问答数据集HealthBench Hard上获得42.8的高分。
-
性能优化与计算效率:
- 相比Llama 4,Muse Spark在达到同等性能水平时所需计算量降低了10.3倍。
- 通过RL训练,模型的成功率在训练数据和未见任务中均呈对数线性增长,证明其泛化能力。
-
个性化推荐能力:
- 该模型将集成到Meta旗下多个平台(如Instagram、Facebook、Threads),为用户提供基于兴趣和行为的个性化购物推荐。

仍存在的短板与挑战
-
编程能力不足:
- 在涉及代码生成与逻辑结构的编程任务中,Muse Spark的表现仍落后于GPT Pro和Gemini Deep Think等模型。
-
Agent类任务表现一般:
- 在需要长时间运行、持续决策的Agent类任务中,模型尚无法与最先进水平竞争。
-
部分任务泛化能力受限:
- 虽然在多个任务中表现出色,但在如物理奥赛理论题等高难度推理任务中仍显吃力。
Meta的闭源路线选择
-
“Meta回来了”信号明确:
- 与以往开源Llama系列不同,Muse Spark采取了完全闭源策略。
- 这一转变表明Meta更重视在商业竞争中构建技术壁垒。
-
闭源带来的优势:
- 更精细的训练过程控制。
- 更高的推理效率与安全防护能力。
- 可集成进Meta生态(如AI助手、AR/VR、广告系统等)。
-
社区与开发者反应:
- 开源爱好者对Meta此举略有失望,但业内普遍认可其商业逻辑的合理性。
未来展望与应用规划
-
医疗AI领域的潜力:
- Muse Spark已与超过1000名医生合作,具备在健康咨询、初步诊断辅助等场景落地的能力。
- 未来可能推动Meta在AI医疗领域占据一席之地。
-
多模态任务的拓展:
- 该模型将成为Meta“分割一切”(Segment Anything)3D版本的技术基础,增强其在图像理解、三维重建等方面的能力。
-
AI Agent与自主任务:
- 尽管目前在Agent任务上仍有不足,但Meta已启动后续版本Muse Spark+的开发,重点优化自主运行能力。
-
国际市场竞争格局:
- Muse Spark目前在AI分析指数中位列第四,仅次于Gemini 3.1 Pro、GPT-5.4和Claude Opus 4.6。
- 这标志着Meta再次跻身AI大模型第一梯队,未来可能在全球AI竞赛中占据更有利位置。
相关阅读
- Meta Agent失控泄密,小扎紧急拉响顶格警报
- 嘈杂场景语音识别准确率怎么提?脸书:看嘴唇
- 小扎对谈黄仁勋:AI模型不开源,脏话我要骂出来
- 推理token减少46%!Meta新方法缩短思维链,告别重复推导
- Meta「分割一切」进入3D时代!图像分割结果直出3D,有遮挡也能复原
- Meta大模型成了“科学造假发动机”,发布3天就在争议中下架
热门文章
- 中国最强编程模型来了!阿里Qwen3.6-Plus性能直逼Claude,国产大模型杀入决赛圈
- 小米MiMo大模型首次推出Token Plan,单次订阅可满足全模态Agent任务需求
量子位 QbitAI 版权所有©北京极客伙伴科技有限公司 京ICP备17005886号-1