首页

登录

Meta亿元天团首个大模型交卷！余家辉宋飏Jason Wei耗时九个月，一雪Llama前耻

3 个月前

AI资讯

75 阅读

AI大模型 [meta 余家辉宋飏]

根据最新公开信息，由余家辉、宋飏和Jason Wei等顶尖AI科学家组成的Meta亿元天团，耗时九个月打造的全新大模型Muse Spark正式发布。这款模型不仅标志着Meta在AI大模型领域的强势回归，更被外界视为对Llama 4未能达到预期表现的一次“雪耻”。

背景与团队组成

顶尖阵容集结：
- Muse Spark项目由Meta重金打造，核心团队成员包括：
- 余家辉：前谷歌资深AI研究员，以高效推理和语言理解模型闻名。
- 宋飏：扩散模型领域的先锋，曾推动Meta在视觉生成方面取得突破。
- Jason Wei：思维链（Chain-of-Thought）技术提出者，现负责模型推理能力设计。
- Hyung Won Chung：OpenAI o1项目核心贡献者之一。
- 团队组建初期，就明确目标——打造一个真正能在推理、多模态、健康等复杂任务上“打硬仗”的模型。
对Llama 4的反思：
- Llama 4虽在开源社区获得高度关注，但其推理能力、效率优化等方面未能在第三方测评中跻身第一梯队。
- Muse Spark的研发正是在这一背景下启动，目标是“用闭源策略实现性能飞跃”。

Muse Spark的技术亮点

测试时推理能力强化：
- 模型在回答复杂问题前会进行“思维压缩”，通过强化学习机制学会在有限token中完成高质量推理。
- 在多个需要深度思考的任务中，表现优于GPT-5.4和Gemini 3.1 Pro的某些版本。
多模态感知与推理：
- Muse Spark在图像、文本、语音等多模态任务上展现出强大能力。
- 例如在医学问答系统MedXpertQA MM中，其表现位居前列，尤其在开放式健康问答数据集HealthBench Hard上获得42.8的高分。
性能优化与计算效率：
- 相比Llama 4，Muse Spark在达到同等性能水平时所需计算量降低了10.3倍。
- 通过RL训练，模型的成功率在训练数据和未见任务中均呈对数线性增长，证明其泛化能力。
个性化推荐能力：
- 该模型将集成到Meta旗下多个平台（如Instagram、Facebook、Threads），为用户提供基于兴趣和行为的个性化购物推荐。

Meta亿元天团首个大模型交卷！余家辉宋飏Jason Wei耗时九个月，一雪Llama前耻

仍存在的短板与挑战

编程能力不足：
- 在涉及代码生成与逻辑结构的编程任务中，Muse Spark的表现仍落后于GPT Pro和Gemini Deep Think等模型。
Agent类任务表现一般：
- 在需要长时间运行、持续决策的Agent类任务中，模型尚无法与最先进水平竞争。
部分任务泛化能力受限：
- 虽然在多个任务中表现出色，但在如物理奥赛理论题等高难度推理任务中仍显吃力。

Meta的闭源路线选择

“Meta回来了”信号明确：
- 与以往开源Llama系列不同，Muse Spark采取了完全闭源策略。
- 这一转变表明Meta更重视在商业竞争中构建技术壁垒。
闭源带来的优势：
- 更精细的训练过程控制。
- 更高的推理效率与安全防护能力。
- 可集成进Meta生态（如AI助手、AR/VR、广告系统等）。
社区与开发者反应：
- 开源爱好者对Meta此举略有失望，但业内普遍认可其商业逻辑的合理性。

未来展望与应用规划

医疗AI领域的潜力：
- Muse Spark已与超过1000名医生合作，具备在健康咨询、初步诊断辅助等场景落地的能力。
- 未来可能推动Meta在AI医疗领域占据一席之地。
多模态任务的拓展：
- 该模型将成为Meta“分割一切”（Segment Anything）3D版本的技术基础，增强其在图像理解、三维重建等方面的能力。
AI Agent与自主任务：
- 尽管目前在Agent任务上仍有不足，但Meta已启动后续版本Muse Spark+的开发，重点优化自主运行能力。
国际市场竞争格局：
- Muse Spark目前在AI分析指数中位列第四，仅次于Gemini 3.1 Pro、GPT-5.4和Claude Opus 4.6。
- 这标志着Meta再次跻身AI大模型第一梯队，未来可能在全球AI竞赛中占据更有利位置。

相关阅读

Meta Agent失控泄密，小扎紧急拉响顶格警报
嘈杂场景语音识别准确率怎么提？脸书：看嘴唇
小扎对谈黄仁勋：AI模型不开源，脏话我要骂出来
推理token减少46%！Meta新方法缩短思维链，告别重复推导
Meta「分割一切」进入3D时代！图像分割结果直出3D，有遮挡也能复原
Meta大模型成了“科学造假发动机”，发布3天就在争议中下架

热门文章

中国最强编程模型来了！阿里Qwen3.6-Plus性能直逼Claude，国产大模型杀入决赛圈
小米MiMo大模型首次推出Token Plan，单次订阅可满足全模态Agent任务需求

量子位 QbitAI 版权所有©北京极客伙伴科技有限公司京ICP备17005886号-1