苹果把Siri交给了Gemini
在2026年6月8日的WWDC主题演讲中,苹果正式推出由Google Gemini大型语言模型驱动的“Siri AI”语音助手。这套系统将随iOS 27、iPadOS 27等新系统于今年秋天免费推送。据Bloomberg记者Mark Gurman报道,苹果每年向Google支付约10亿美元,使用一个约1.2万亿参数的定制Gemini模型负责Siri的云端功能。CNBC披露,这份多年协议于2026年1月12日签署,双方此前均未公开细节。这一变化彻底推翻了苹果此前“全自研AI”的承诺——原定在iOS 18上线的AI功能因内部测试瓶颈一再延期,独立科技分析网站Binary Response评论称,“当苹果一再公开承诺又一再悄悄错过,这已从产品延迟变成信誉问题。”
十年十亿美元:苹果为何放弃全自研?
苹果自研AI模型的努力在关键节点受阻。CNBC报道,相关功能在内部测试中遭遇严重瓶颈,原定iOS 18上线的时程一拖再拖。同时,苹果在先进制程芯片供应上也受制于台积电——Tom's Hardware指出,苹果的芯片策略被台积电供应限制所影响,这反过来拖慢了自研AI模型的部署节奏。而Google Gemini在长上下文(最高100万token)和多模态理解上的成熟能力,使苹果最终选择支付每年约10亿美元的成本,用外部模型解决云端AI的“最后一公里”。这一签约金额也反映出,苹果不再执着于“所有能力自研”,而是更务实地将核心对话能力外包,自己专注硬件生态与系统集成。
从单一模型到多模型枢纽:Siri变身调度中枢
新版Siri的架构并非“只认Gemini”。根据发布会信息,Apple Intelligence构建了三层计算体系:
- 设备端:约30亿参数的本地模型处理基础任务,保证响应速度与离线可用性。
- Private Cloud Compute(PCC):当需要更大算力时,启用安全云环境,仅传输必要数据且不用于训练。
- 外部模型供应:Gemini作为默认云端引擎,同时ChatGPT、Claude等第三方模型以“用户主动选入”方式支持无缝切换。苹果还发布了Core AI框架,向开发者开放系统级多模型调度能力。
这意味着用户无需手动切换网页或账号,Siri会自动判断任务类型并调用最合适的模型。比如处理整份合约或会议逐字稿时,Gemini的长上下文优势会被激活;而需要创意写作时,系统可无缝换用Claude或GPT。苹果正把“模型选择”从用户负担转化为系统的隐形能力。
对用户而言:体验升级,但隐忧仍在
对于普通iPhone用户,最直接变化是Siri终于能“把事做完”——不再只是回答简单问题,而是能执行复杂任务流:整理文档、操作App、跨应用串联工作。多供应商并存意味着体验不再被单一模型的能力瓶颈拖累。但这也带来了新问题:
- 隐私边界:当谷歌Gemini能直接操作iPhone设置、开App、处理整串任务时,用户数据可能触及Google。有分析指出,苹果过去因Google高层进入董事会导致iPhone概念外流的历史,可能重演。
- 成本分摊:每年10亿美元的授权费是否会转嫁给用户?目前苹果未明确是否额外收费。而模型调用产生的Token消耗,对大容量用户而言可能带来隐性成本。
- 等待期:iOS 27正式推送至少要到今年秋天,普通用户目前仍需自行管理多模型API密钥与账单。有从业者建议提前使用聚合中转服务,统一管理Token池,以便在系统级支持到来时无缝衔接。
整体来看,苹果的转变释放了一个关键信号:AI竞争的焦点正从“谁的模型更强”转向“谁能定义入口与调度规则”。当iPhone成为多模型协作的枢纽时,用户的体验将不再受困于单一模型的进度,而苹果则握紧了“转乘规则”制定权。