摘要
2026年6月9日,苹果在WWDC 2026全球开发者大会上正式发布了全新Siri AI——这是Siri自2011年问世以来最大规模的一次升级。与以往不同的是,苹果首次公开承认其AI核心能力借力外部大模型:全新Siri AI的云端推理能力基于Google Gemini模型构建,运行在Google Cloud服务器上,而端侧处理则由Apple Silicon的神经网络引擎完成。苹果高级软件工程副总裁Craig Federighi在发布会上强调:“真正有用的AI必须围绕你和你的需求来构建”,并将新Siri定位为"以人为中心"的AI助手,区别于其他公司"为AI而AI"的激进路线。与此同时,苹果还宣布macOS 27将仅支持Apple Silicon芯片,正式终结Intel Mac时代,其核心驱动力正是端侧AI能力对统一内存架构和神经网络引擎的刚性需求。这一系列发布标志着苹果AI战略从"保守自研"转向"务实合作"的关键转折。
事件背景
WWDC 2026:苹果AI战略的关键时刻
WWDC(Worldwide Developers Conference)是苹果每年最重要的开发者大会。2026年的WWDC对苹果而言意义非凡——在Google、OpenAI、微软等竞争对手纷纷推出颠覆性AI产品的大背景下,苹果的AI战略一直备受质疑。2025年WWDC上,苹果展示了一份"克制而务实"的AI升级方案,被媒体评价为"保守主义"策略。一年后,苹果终于交出了一份完全不同的答卷。
Siri的十五年进化史
| 时间 | 里程碑 | 核心能力 |
|---|---|---|
| 2011年 | Siri随iPhone 4S发布 | 基础语音指令、简单问答 |
| 2016年 | Siri开放第三方App集成 | SiriKit开发者框架 |
| 2023年 | 大语言模型概念兴起 | Siri仍依赖传统NLP |
| 2024年 | Apple Intelligence概念提出 | 端侧AI模型初步尝试 |
| 2025年 | Siri小幅升级 | 多轮对话(最多5轮)、响应速度提升40% |
| 2026年 | Siri AI正式发布 | Google Gemini驱动、深度多轮对话、复杂任务执行 |
从2011年到2025年,Siri经历了多次迭代,但始终未能摆脱"不够聪明"的用户印象。当Google Assistant和ChatGPT已经能够处理复杂多步骤任务时,Siri仍停留在"设定闹钟"和"查天气"的层面。这次WWDC 2026,苹果决定彻底改变这一局面。
核心技术解析
技术架构:Google Gemini云端 + Apple Silicon端侧
苹果此次公布的AI架构采用了端侧+云端混合推理的双层模式,这是理解整个Siri AI技术体系的关键。
graph TD
subgraph 用户设备层
A[用户语音/文本输入] --> B{端侧路由判断}
B -->|简单请求| C[Apple Silicon<br/>神经网络引擎]
C --> C1[文本补全]
C --> C2[本地搜索]
C --> C3[图像识别]
C --> C4[语音转文字]
end
subgraph 私有云计算层
B -->|复杂请求| D[Private Cloud Compute<br/>端到端加密]
D --> E[加密传输通道]
end
subgraph Google Cloud层
E --> F[Google Gemini<br/>Pro/Ultra模型]
F --> F1[多模态理解]
F --> F2[长文本分析]
F --> F3[复杂推理]
F --> F4[世界知识检索]
end
F1 --> G[加密返回结果]
F2 --> G
F3 --> G
F4 --> G
G --> D
D --> H[解密并呈现给用户]
C1 --> H
C2 --> H
C3 --> H
C4 --> H
端侧模型
端侧运行的AI模型是基于Google Gemini蒸馏的小参数模型,在Apple Silicon的**Neural Engine(神经网络引擎)**上本地执行。苹果采用了两级模型策略:
- 高能力模型:仅支持iPhone Air、iPhone 17 Pro、搭载M4及以上芯片且内存≥12GB的iPad、搭载M3及以上芯片且内存≥12GB的Mac
- 标准模型:面向其他支持Apple Intelligence的设备,功能有所缩减,缺少更自然的语音表达和高级校对功能
这种分层策略反映了苹果在模型能力与硬件适配之间的平衡考量——端侧模型受限于设备内存和算力,不可能在所有设备上运行同等规模的模型。
云端模型
对于超出端侧处理能力的复杂请求(多模态理解、长文本分析、复杂推理等),系统通过**Private Cloud Compute(私有云计算)**将加密后的请求发送到Google Cloud的GPU集群,由Gemini Pro/Ultra模型处理。这是苹果首次在核心产品中依赖外部云基础设施进行AI推理。
关键创新点
1. 自然对话与多轮上下文理解
Siri AI最大的突破在于对话式交互的根本性升级。苹果展示了一系列脚本化的多轮对话演示,展示了Siri AI在不同使用模式和应用任务之间无缝切换的能力。
以一个典型场景为例:
|
|
这段对话展示了三个关键能力:
- 跨应用上下文检索:Siri可以搜索Messages、邮件等应用中的信息,即使用户不记得具体存储在哪个应用
- 多步骤任务规划:从信息查询到内容整合再到发送执行,一气呵成
- 个人化上下文:记住"朋友Maria"是谁,“群聊"指的是哪个
2. 私有云计算加密架构
这是苹果AI战略中最具差异化的技术。苹果强调,即使AI请求运行在Google的服务器上,用户数据仍通过Private Cloud Compute技术保持加密——苹果和Google均无法读取用户数据。
具体实现包括:
- 硬件安全模块(HSM):PCC使用专用的硬件安全模块进行密钥管理
- 端到端加密:数据从设备到云端全程加密,云端仅在加密状态下处理
- 独立审计:苹果承诺发布PCC完整技术白皮书,并邀请第三方安全专家进行独立审计
这意味着苹果的隐私保护品牌从"本地处理"延伸到了"云端AI”,解决了用户对数据安全的顾虑。
3. 视觉智能与屏幕感知
Siri AI新增了**Visual Intelligence(视觉智能)**能力:
- 从相机App直接获取视觉信息并给出相关回答
- 从复杂图片中提取结构化信息(如从演唱会日程图片中批量提取日历提醒)
- 在VisionOS上,可以直接对物理世界中的物体提问
此外,Siri AI还具备屏幕感知能力——它能理解当前设备屏幕上正在显示的内容,从而提供更贴合当下情境的辅助。
性能评测:与竞品语音助手对比
| 能力维度 | Siri AI (2026) | Google Assistant | ChatGPT语音 |
|---|---|---|---|
| 多轮对话 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 设备深度集成 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐ |
| 隐私保护 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ |
| 跨应用任务执行 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ |
| 世界知识 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 端侧处理能力 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ |
| 多模态理解 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
Siri AI的核心优势在于设备深度集成——它能调用Messages、邮件、日历、地图等系统级应用,结合用户的个人数据提供高度个性化的服务。这是云端AI助手难以复制的能力。
行业影响
对市场的影响:苹果首次承认借力外部大模型
苹果选择Google Gemini作为Siri AI的核心引擎,是整个AI行业格局中的一个标志性事件。这意味着:
graph TD
A[苹果借力Google Gemini] --> B[行业格局变化]
A --> C[竞争关系重构]
A --> D[技术路线验证]
B --> B1[最后一个主流科技巨头<br/>完成AI转型表态]
C --> C1[苹果与Google:<br/>搜索广告是对手,AI能力是伙伴]
C --> C2[苹果与OpenAI:<br/>从潜在合作到间接竞争]
D --> D1["模型外包+体验整合+<br/>隐私差异化"成为第三条路线]
第一,这标志着最后一个主流科技巨头完成了AI转型的表态。 在微软深度绑定OpenAI、Google全力推Gemini、Meta开源Llama之后,苹果终于选择了自己的AI路线。
第二,苹果与Google的关系变得更加复杂。 两家公司在搜索广告领域是直接竞争对手(苹果每年从Google收取数十亿美元的默认搜索引擎费用),但在AI能力上却成了合作伙伴。分析师认为,这种"竞合关系"可能会在长期影响苹果的战略自主性。
第三,苹果验证了"第三条AI路线"。 与微软的"全栈自研+深度绑定OpenAI"、Google的"模型即平台+搜索生态整合"不同,苹果选择了"模型外包+体验整合+隐私差异化"。这条路线能否成功,取决于苹果能否在借力外部模型的同时逐步建立自研能力。
对开发者的意义:iOS AI开发生态
对于开发者而言,macOS 27和iOS系统带来了系统级的AI开发支持:
- 系统级ML框架:支持本地运行70亿参数以内的模型
- 统一内存架构:大模型可以直接在GPU显存中加载
- 新AI API:任何应用都可以调用系统级AI能力,无需自行部署模型
苹果还推出了Write with Siri功能,允许开发者在几乎所有文本输入场景中集成Apple Intelligence的文本生成能力。同时,新的AI驱动自动校对系统将在系统全局范围内检查写作风格。
商业化前景
端侧AI战略与硬件绑定
macOS 27仅支持Apple Silicon的决定,其核心驱动力是AI——Apple Silicon的统一内存架构和神经网络引擎是本地运行AI模型的前提条件。这一决策将带来以下商业影响:
| 影响维度 | 具体表现 |
|---|---|
| 换机潮 | 大量存量Intel Mac用户需要升级硬件 |
| 产品线精简 | Intel Mac逐步退出产品线 |
| AI功能分层 | 高能力AI模型仅支持新款芯片设备 |
| iCloud+订阅 | 云端AI功能(如图像生成)设日使用限制,iCloud+用户享有更高额度 |
国行iPhone的AI困境
值得注意的是,由于中国的AI监管要求(大模型备案、数据本地化等),国行iPhone用户仍无法使用完整的Apple Intelligence功能。苹果正在与国内AI厂商(据传为百度文心或阿里千问)谈判合作,但进展缓慢。这意味着中国iPhone用户在AI功能上将与国际版存在显著差距。
实际体验
使用场景
场景一:日常多轮对话
Siri AI支持真正意义上的多轮对话,而非传统的"一问一答"模式。用户可以像和朋友聊天一样,随时切换话题、追问细节、要求执行操作。对话记录会存储在本地和iCloud中,通过全新的专属Siri App管理,用户可以在一台设备上开始对话,在另一台设备上继续。
场景二:复杂任务执行
以出行为例:用户先询问一张照片中拱门的拍摄地点,然后要求查找最近搬家的朋友Jeff的新地址,最后让Siri规划一条"先去拱门、中途经过Jeff家"的导航路线——整个过程Siri AI自动完成信息整合和Apple Maps导航设置,无需用户手动在各应用间切换。
场景三:Mac上的深度集成
在macOS上,Siri AI的功能深度集成到了Spotlight搜索中——系统能识别出何时应该启动Siri对话而非仅显示文件列表。用户还可以通过Ctrl+Click对照片、文件、文本甚至多个文件同时向Siri提问。
优势与不足
优势:
- 设备集成度极高:与iOS/macOS系统级深度整合,能跨应用调用个人数据
- 隐私保护行业领先:PCC加密架构确保云端AI也不泄露用户数据
- 个人化能力强:利用设备上的"个人上下文"提供高度定制化的服务
- 多设备连续性:对话记录通过iCloud同步,跨设备无缝衔接
- 语音表达更自然:新模型带来更富表现力的语音,支持语速和表现力自定义调节
不足:
- 语言支持有限:首发仅支持英语,其他语言需后续更新
- 硬件门槛较高:最强模型仅支持最新款芯片和≥12GB内存设备
- 云端功能有使用限制:图像生成等依赖云端的功能设有每日使用上限
- 自研模型缺席:核心能力依赖Google Gemini,长期战略自主性存疑
- 国行功能缺失:中国用户暂时无法体验完整AI功能
总结与展望
苹果WWDC 2026的发布可以用一句话概括:“苹果终于在AI上迈出了实质性的一步——但这一步是踩在Google Gemini的肩膀上。”
Siri AI的发布标志着苹果的AI策略从2025年的"保守主义"转向了2026年的"务实合作"。这次转变有三个核心意义:
- 承认现实:苹果坦诚地接受了自研大模型尚未成熟的现实,选择与Google合作来快速补齐AI能力短板
- 差异化定位:通过"设备深度集成+隐私保护+个人化体验"的组合,构建了云端AI助手难以复制的竞争壁垒
- 硬件驱动AI:macOS 27终结Intel Mac时代,将AI能力与硬件升级深度绑定,开启新一轮换机周期
未来12个月是关键观察窗口。 苹果需要在借力Google的同时加速自研模型的突破,否则长期依赖竞争对手的核心技术将侵蚀其战略自主性。与此同时,隐私保护能否真正成为AI时代的差异化竞争力——当所有平台都在提供AI能力时,隐私承诺是否足以让用户为苹果生态支付溢价——这个问题的答案,可能不在今天的WWDC上,而在未来的产品迭代中逐步显现。
对于开发者和用户来说,如果你已经在使用Apple Silicon设备,Siri AI的到来将显著提升日常使用体验。如果你正在考虑购买新设备,iPhone 17 Pro系列和搭载M3+芯片的Mac将是体验完整AI能力的最佳选择。
参考来源: