Meta发新模型Muse Spark:从开源转向封闭,闭源阵营的最后一博?
背景:开源与闭源的长期博弈
近年来,AI 大模型的发展经历了从“拼参数”到“拼生态”的转变。在这一过程中,模型是否开源成为厂商之间的关键分水岭。
- 闭源阵营如 OpenAI 和 Anthropic,凭借商业化路径迅速崛起,年收入已达到数十亿美元。
- 开源阵营则以 DeepSeek、阿里巴巴的 Qwen 和月之暗面的 Kimi 为代表,在推理能力、部署灵活性和成本控制方面不断追赶。
Meta 曾是开源阵营的代表,其 Llama 系列模型在 2023 年逐步开放,受到开发者欢迎。但在 2025 年发布 Llama 4 后,外界对其模型“刷榜”的质疑不断。这也促使 Meta 在 2025 年中期进行大规模重组,并成立 Meta Superintelligence Labs(MSL),开始转向闭源战略。
Muse Spark:Meta 的闭源试水之作
2026 年 4 月 8 日,Meta 发布了 Muse Spark 系列模型,这是 MSL 自成立以来的首个正式产品,标志着 Meta 从开源转向闭源的关键一步。
- 模型定位:Muse Spark 是一款原生多模态推理模型,强调高效率与个性化能力。
- 核心功能:支持工具调用、视觉推理链(visual chain of thought)和多智能体(Agent)协同。
- 应用绑定:模型深度整合进 Meta 旗下产品生态,包括 Facebook、Instagram、WhatsApp、Messenger 和 AI 眼镜。
Meta 首席执行官扎克伯格表示,Muse Spark 是构建“个人超级智能体”的第一步,目标是为 30 亿用户提供高度智能化的服务。
性能表现:局部领先,整体仍有差距
根据 Meta 公布的内部基准测试结果,Muse Spark 在某些任务上表现优异,但尚未全面超越当前头部闭源模型。
多模态与健康问答表现亮眼
- 在 CharXiv Reasoning 测试中(图表理解),Muse Spark 得分为 86.4,超过 GPT-5.4(82.8)和 Gemini 3.1 Pro(80.2)。
- 在 HealthBench Hard(健康问答)中,Muse Spark 获得 42.8,高于 GPT-5.4(40.1)和 Gemini 3.1 Pro(20.6),这得益于与上千名医生合作整理的医学数据。
- 在 MedXpertQA MM(医学影像问答)中,Muse Spark 得分 78.4,略低于 Gemini 3.1 Pro(81.3),但高于 GPT-5.4(77.1)。
编程与 Agent 任务仍存短板
- 在 Terminal-Bench 2.0(终端编程)中,Muse Spark 得分为 59.0,远低于 GPT-5.4(75.1)和 Gemini(68.5)。
- 在 SWE-Bench Pro(代码修复能力)中,Muse Spark 得分为 52.4,落后于 GPT-5.4(57.7)和 Gemini 3.1 Pro(54.2)。
- 在 Humanity's Last Exam(跨学科极难问题)中,Muse Spark 有工具辅助时得分为 58.0,略胜于 GPT-5.4 Pro(58.7),但差距不大。
- 在 FrontierScience Research(前沿科学推理)中,Muse Spark 表现优于 GPT 和 Gemini,得分为 38.3,GPT-5.4 Pro 为 36.7,Gemini Deep Think 仅 23.3。
Meta 也坦承,Muse Spark 并非新的 SOTA(state-of-the-art),但在特定任务上具备竞争力。
推理模式创新:沉思模式与 Agent 编排
Muse Spark 引入了一种新的推理模式——“沉思模式(Contemplating mode)”,其核心是通过多智能体并行推理,提升复杂任务的处理能力。
- 模型会编排多个 Agent 并行思考,然后汇总结果,对标 Gemini 的 Deep Think 和 GPT Pro 的极限推理模式。
- 在 Humanity’s Last Exam 中,沉思模式下的 Muse Spark 得分达到 58.4%,略逊于 GPT-5.4 Pro 的 58.7%,但优于其他竞品。
- 在 FrontierScience Research 中,沉思模式下的 Muse Spark 表现为 38.3%,超过 GPT-5.4 Pro 的 36.7% 和 Gemini 的 23.3%。
这种架构设计为 Meta 提供了更高的控制权,也便于其在产品中进行深度集成。
战略转型:Meta AI 实验室的重组与野心
Meta 在 2025 年启动了大规模 AI 战略调整,收购了数据标注公司 Scale AI,并将其创始人汪滔引入公司领导新成立的 Meta Superintelligence Labs(MSL)。
- 该实验室的目标是在 2026 年推出具备行业领先水平的下一代模型,并构建服务个人用户的“超级智能体(Superintelligence Agent)”。
- 扎克伯格亲自参与 AI 人才招募,开出高达 1 亿美元的薪资吸引顶尖人才。
这一系列动作被视为 Meta 对开源路线“未达预期”的回应。尽管 Llama 系列广受开发者欢迎,但其商业化路径模糊,而 OpenAI、Anthropic 等闭源厂商已建立起稳定收入来源。
行业影响:开源趋势下的闭源反扑
Muse Spark 的发布在业界引发了广泛讨论:
- 对开源模型的冲击:作为开源鼻祖之一的 Meta 突然转向闭源,是否意味着开源红利正在消退?
- 商业化路径的回归:Meta 的千亿美元投入始终未能通过开源模型获得回报,转向闭源或许是其战略纠偏。
- 闭源模型的护城河:以 Anthropic、OpenAI 为代表的闭源厂商,通过 API、平台控制、企业客户锁定等方式建立了稳定的商业模式。
但开源模型也并非没有反击。
- DeepSeek 以极低成本推出完全开源模型 R1,引发英伟达市值剧烈波动。
- 阿里 Qwen 形成完整开源体系,下载量达 7 亿次,成为全球使用最广泛的开源模型之一。
- Kimi 在 2026 年开源 2.5 版本,强化多模态和工具调用能力,推动实际应用落地。
李彦宏曾在 2024 年表示闭源模型更有商业化潜力,而文心大模型 4.5 的开源则是百度对该策略的微妙调整。
结语:Muse Spark 是 Meta 的最后一搏吗?
在开源模型不断侵蚀闭源模型护城河的背景下,Meta 选择将 Muse Spark 闭源,显然是一种战略选择。它试图通过深度绑定自身生态和提升推理效率,重新夺回在大模型赛道的竞争力。
虽然 Muse Spark 并未全面超越 GPT-5.4 和 Gemini 3.1 Pro,但其在健康、多模态理解和前沿科研方面的表现,展示了 Meta 的潜力。未来是否开源,以及是否能在商业化方面实现突破,将成为衡量 Meta 这场 AI 战略转型成败的关键指标。