Meta发新模型Muse Spark：从开源转向封闭，闭源阵营的最后一博？

3 个月前

AI资讯

70 阅读

人工智能 [meta 开源与闭源模型更新]

背景：开源与闭源的长期博弈

近年来，AI 大模型的发展经历了从“拼参数”到“拼生态”的转变。在这一过程中，模型是否开源成为厂商之间的关键分水岭。

闭源阵营如 OpenAI 和 Anthropic，凭借商业化路径迅速崛起，年收入已达到数十亿美元。
开源阵营则以 DeepSeek、阿里巴巴的 Qwen 和月之暗面的 Kimi 为代表，在推理能力、部署灵活性和成本控制方面不断追赶。

Meta 曾是开源阵营的代表，其 Llama 系列模型在 2023 年逐步开放，受到开发者欢迎。但在 2025 年发布 Llama 4 后，外界对其模型“刷榜”的质疑不断。这也促使 Meta 在 2025 年中期进行大规模重组，并成立 Meta Superintelligence Labs（MSL），开始转向闭源战略。

Muse Spark：Meta 的闭源试水之作

2026 年 4 月 8 日，Meta 发布了 Muse Spark 系列模型，这是 MSL 自成立以来的首个正式产品，标志着 Meta 从开源转向闭源的关键一步。

模型定位：Muse Spark 是一款原生多模态推理模型，强调高效率与个性化能力。
核心功能：支持工具调用、视觉推理链（visual chain of thought）和多智能体（Agent）协同。
应用绑定：模型深度整合进 Meta 旗下产品生态，包括 Facebook、Instagram、WhatsApp、Messenger 和 AI 眼镜。

Meta 首席执行官扎克伯格表示，Muse Spark 是构建“个人超级智能体”的第一步，目标是为 30 亿用户提供高度智能化的服务。

性能表现：局部领先，整体仍有差距

根据 Meta 公布的内部基准测试结果，Muse Spark 在某些任务上表现优异，但尚未全面超越当前头部闭源模型。

多模态与健康问答表现亮眼

在 CharXiv Reasoning 测试中（图表理解），Muse Spark 得分为 86.4，超过 GPT-5.4（82.8）和 Gemini 3.1 Pro（80.2）。
在 HealthBench Hard（健康问答）中，Muse Spark 获得 42.8，高于 GPT-5.4（40.1）和 Gemini 3.1 Pro（20.6），这得益于与上千名医生合作整理的医学数据。
在 MedXpertQA MM（医学影像问答）中，Muse Spark 得分 78.4，略低于 Gemini 3.1 Pro（81.3），但高于 GPT-5.4（77.1）。

编程与 Agent 任务仍存短板

在 Terminal-Bench 2.0（终端编程）中，Muse Spark 得分为 59.0，远低于 GPT-5.4（75.1）和 Gemini（68.5）。
在 SWE-Bench Pro（代码修复能力）中，Muse Spark 得分为 52.4，落后于 GPT-5.4（57.7）和 Gemini 3.1 Pro（54.2）。
在 Humanity's Last Exam（跨学科极难问题）中，Muse Spark 有工具辅助时得分为 58.0，略胜于 GPT-5.4 Pro（58.7），但差距不大。
在 FrontierScience Research（前沿科学推理）中，Muse Spark 表现优于 GPT 和 Gemini，得分为 38.3，GPT-5.4 Pro 为 36.7，Gemini Deep Think 仅 23.3。

Meta 也坦承，Muse Spark 并非新的 SOTA（state-of-the-art），但在特定任务上具备竞争力。

推理模式创新：沉思模式与 Agent 编排

Muse Spark 引入了一种新的推理模式——“沉思模式（Contemplating 开心版e）”，其核心是通过多智能体并行推理，提升复杂任务的处理能力。

模型会编排多个 Agent 并行思考，然后汇总结果，对标 Gemini 的 Deep Think 和 GPT Pro 的极限推理模式。
在 Humanity’s Last Exam 中，沉思模式下的 Muse Spark 得分达到 58.4%，略逊于 GPT-5.4 Pro 的 58.7%，但优于其他竞品。
在 FrontierScience Research 中，沉思模式下的 Muse Spark 表现为 38.3%，超过 GPT-5.4 Pro 的 36.7% 和 Gemini 的 23.3%。

这种架构设计为 Meta 提供了更高的控制权，也便于其在产品中进行深度集成。

战略转型：Meta AI 实验室的重组与野心

Meta 在 2025 年启动了大规模 AI 战略调整，收购了数据标注公司 Scale AI，并将其创始人汪滔引入公司领导新成立的 Meta Superintelligence Labs（MSL）。

该实验室的目标是在 2026 年推出具备行业领先水平的下一代模型，并构建服务个人用户的“超级智能体（Superintelligence Agent）”。
扎克伯格亲自参与 AI 人才招募，开出高达 1 亿美元的薪资吸引顶尖人才。

这一系列动作被视为 Meta 对开源路线“未达预期”的回应。尽管 Llama 系列广受开发者欢迎，但其商业化路径模糊，而 OpenAI、Anthropic 等闭源厂商已建立起稳定收入来源。

行业影响：开源趋势下的闭源反扑

Muse Spark 的发布在业界引发了广泛讨论：

对开源模型的冲击：作为开源鼻祖之一的 Meta 突然转向闭源，是否意味着开源红利正在消退？
商业化路径的回归：Meta 的千亿美元投入始终未能通过开源模型获得回报，转向闭源或许是其战略纠偏。
闭源模型的护城河：以 Anthropic、OpenAI 为代表的闭源厂商，通过 API、平台控制、企业客户锁定等方式建立了稳定的商业模式。

但开源模型也并非没有反击。

DeepSeek 以极低成本推出完全开源模型 R1，引发英伟达市值剧烈波动。
阿里 Qwen 形成完整开源体系，下载量达 7 亿次，成为全球使用最广泛的开源模型之一。
Kimi 在 2026 年开源 2.5 版本，强化多模态和工具调用能力，推动实际应用落地。

李彦宏曾在 2024 年表示闭源模型更有商业化潜力，而文心大模型 4.5 的开源则是百度对该策略的微妙调整。

结语：Muse Spark 是 Meta 的最后一搏吗？

在开源模型不断侵蚀闭源模型护城河的背景下，Meta 选择将 Muse Spark 闭源，显然是一种战略选择。它试图通过深度绑定自身生态和提升推理效率，重新夺回在大模型赛道的竞争力。

虽然 Muse Spark 并未全面超越 GPT-5.4 和 Gemini 3.1 Pro，但其在健康、多模态理解和前沿科研方面的表现，展示了 Meta 的潜力。未来是否开源，以及是否能在商业化方面实现突破，将成为衡量 Meta 这场 AI 战略转型成败的关键指标。