当前位置: 首页 » 资讯 » 科技头条 » 正文

苹果智能终于成了?AI让Siri告别「智障」,Gemini驱动脱胎换骨

IP属地 中国·北京 雷科技 时间:2026-06-09 06:24:41

大家「期待」已久的 WWDC26 主题演讲终于结束,雷科技也是全程看完了发布会,先说重点:接下来会讲到的 AI(Apple 智能、Siri AI)新功能,现阶段与中国内地用户、国行 Apple 设备没有任何关系,本次 AI 更新依旧是「环内地、环欧盟」发布。



Apple

但话又说回来,如果你正在使用外版手机搭配外版 Apple ID,那这次的 Apple 智能更新可以说「量大管饱」,不仅让Apple 智能在功能上「追平」了当前业内最激进的 AI Agent 手机,甚至还基于 Apple 的全平台生态能力和对保护隐私的追求,打出了带有 Apple 特色的「组合拳」。对广大国行用户来说,不能用也来一波「望梅止渴」吧,万一哪天Apple智能真的在大家的「期待-失望-期待」循环中如约而至了呢?

「换心」Google Gemini,苹果自己也有整活

我们先来说说全新的 Apple 智能模型。和之前大张旗鼓的「预热」一样,新一代的 Apple 基础模型(Apple Foundation Model、下文简称 AFM)基于 Gemini 基础模型(暂时不确定是哪一代基础模型)打造的,而非直接使用 Gemini。

如果大家不能理解这个关系,雷科技给大家打个比方:

A 餐厅做菜很难吃,觉得 G 餐厅做的菜挺不错,就找 G 餐厅买了一份完整食谱(Gemini 基础模型)回来,并按照自己的理解把这套食谱理解、改良成自己的食谱(AFM)。
但这本食谱是一次买卖,G 餐厅之后如果自己调整了食谱,没有义务向 A 餐厅提供后续的更新和支持,全靠 A 餐厅自行领悟。

而在 Apple 手里,这个引进 Gemini 技术并「私有化」后的基础模型也分化成了两个模式(分支)——可以直接在 iPhone、iPad 和 Mac 等设备端运行,也可以在 Apple 的私有云计算服务器上运行。换句话说,全新的 Apple 智能走的依旧是混合模型方案,但不再像之前接入 ChatGPT 时那样事事都依赖 OpenAI 的 API。



Apple

很显然,这种设备端侧大模型+私有云计算模型的组合,可以最大限度地保证用户数据停留在 Apple 可控的范围内,从而保护用户的个人隐私。根据 Apple 的说法,用户数据 Apple 无法获取,也只会用于响应用户请求。

另外,Apple 也推出了更强的第二代「设备端模型」(非上文提到的 AFM),带来了更好的多模态能力。



Apple

与之匹配的,iOS、iPadOS 和 macOS 也为全新的 Apple 智能提供了更丰富的系统级支持,让 Apple 智能可以深入到「全家桶」的方方面面。

而这一切新技术为用户带来了第一道硬菜,自然是全新的 Siri。

AI驱动后,Siri彻底告别「语音智障」

命名上,这个由 Apple 智能驱动的新 Siri 很没有创意,直接就叫「Siri AI」。但在交互方式、理解能力等方面,Siri AI 的提升相当显著。

首先,Apple 终于为 Siri AI 准备了一个独立的 App,就像 ChatGPT、Gemini、Grok App 一样,允许用户在统一入口看到完整的 Siri AI 交互记录。



Apple

另外,此前在网上已经曝光的「灵动岛 Siri」界面在 WWDC26 上也得到了确认;iPhone 用户除了长按侧边按键、Hey Siri 之外,也可以通过顶部下拉的方式激活 Siri。



Apple

而在能力上,全新的 Siri AI 也拥有了「感知」「理解」「调用」「执行」的能力。

我们先来说说「感知」。得益于 AFM 多模态能力的提升,全新的 Siri AI 现在不仅能「听」用户说的话,也能「看」到相机拍摄与屏幕显示的内容。这里的「感知」并不仅仅局限于文字,就连图片也可以输入。当然了,语音感知能力 Siri AI 也不会落下。



Apple

Apple 并未在 WWDC 主题演讲中披露 Siri AI 感知画面的具体手段,雷科技也不敢笃定 Siri 是像 Android 手机那样基于屏幕截图、录制的 GUI Agent?还是 Apple 发挥了自己第一方开发者的优势,为 Siri AI 提供了全新的 API?

在感知屏幕内容后,Siri AI 可以理解屏幕内容,并对此作出响应,比如对着旅游照片查找拍摄地点,对着点餐收据计算每个人该给多少钱,或者推算食物的营养信息。

至于执行,Apple 也确实充分发挥了「主场优势」:Siri AI 可以直接用感知的信息去创建复杂任务,比如直接生成到拍摄点「三天两夜」的旅游规划,也能直接调用多个系统 App 执行相关操作(三方 App 支持情况未知)。

而在 macOS 上,Siri AI 还解锁了更丰富的能力,可以直接对多份文档进行对比、总结和修改,活脱脱一个 AI Agent 客户端的样子。



Apple

有趣的是,继之前的「可选音色」后,Apple 也为 Siri AI 准备了新一轮的自定义音色功能:用户可以直接以「拖进度条」的方式,自定义 Siri AI 的音色、语气语速等设置,打造出「只属于自己」的 Siri AI。



Apple

支持语言方面,Siri AI 现支持英语,未来将开放包含中文(简体、繁体)之外的多种语言。但就像我们开头提到的那样,此次 Siri AI 依旧是「环内地、环欧盟」更新,国行用户依旧得「等通知」。

不只是Siri,Safari、快捷指令都吃上AI

作为 Apple 智能「划时代」的大作,Apple 也把AI四大能力(「感知」「理解」「调用」「执行」)深入到其他App 的方方面面。

比如全新的 Safari,在接入了 Apple 智能后可以利用其能力对打开了的标签页进行「智能分组」。这对永远开着几百个标签页来查资料的雷科技编辑来说极为实用。

基于 Apple 智能的多模态感知能力,拥有 AI 能力的 Safari 现在也可以在后台帮你智能监控某个网页,待网页内容更新后向用户发送通知。对于有「网页抢票」的用户来说,这项功能非常实用。

这还没完,我们知道 Safari 可以安装第三方插件,而全新的 Apple 智能为用户提供了「自制浏览器插件」的功能:用户只要用自然语言告诉 Safari「自己需要一个怎样的插件?能实现什么功能?」Safari 就能用 AI 自己写一个满足你需求的插件出来。



Apple

没错,Safari 也玩上了「Vibe Coding」。

同样支持「Vibe Coding」的还有全新的「快捷指令」:以前想创建一个快捷指令,我们需要在「浩瀚无垠」的列表里选择触发组件和执行组件,再以写代码的严谨程度写出完整的运行逻辑。即使是小雷也不得不承认,这套复杂且有门槛的流程劝退了不少用户,也「白瞎」了快捷指令这个这么好用的 App。

但随着快捷指令接入 Apple 智能,我们只要自然语言讲出自己的实际需求,比如「当我 5 分钟后有外地日程,且行程没有机票或车票信息时,自动打开车内空调」,快捷指令就会在能力范围内自动搜索各个 App(包含第三方)的执行能力,并自动生成执行文件,之后我直接用就行。



Apple

国内没什么人用的「Apple 家庭」智能家居系统也迎来了更新:对于安装了 HomeKit 摄像头并开启相关服务的用户,家庭 App 可以后台分析监控画面并总结归纳成文字;也可以根据用户提问,直接找到对应的视频片段。



Apple

曾被小雷称作「鸡肋」的图乐园也迎来了全面升级,不仅加入了自然语言生图的能力(旧版需要在固定选项里选择风格),还可以根据用户要求任意调整风格和画面内容。

Apple 智能这种超强的图片能力也为 Apple 智能带来了更强的 AI 图片修改能力:除了常见的物件消除、AI 扩图外,Apple 这次为相册 App 加入了「空间构图」能力,可以把不同照片先拓展成带有空间深度信息的空间照片,然后再重新取景,为传统的二维再取景(裁切)加入了「Z」轴。



Apple

从 WWDC 主题演讲上看,这个功能和现在 iPhone 已有的「空间壁纸」转化差不多,但精细程度明显更高。另外 Apple 也提到,这个「空间壁纸」会先利用设备端模型来实现低延迟的实时操作,再调用私有云计算执行完整的渲染。

「换心」成功,Apple智能终于上桌了

收费方面,Apple 提到 Apple 智能部分利用到私有云计算能力的 AI 功能有每天使用次数限制,但 iCloud+ 会加入相关权益。

当然了,对于使用国行 iPhone、iPad 的用户来说,这些 Apple 智能的新功能依旧是「海市蜃楼」——这些功能在某处确实存在,但我们「看得见、摸不着」。

不过话又说回来,在雷科技看来,Apple 在 WWDC 26「秀肌肉」,确实也有其积极意义。过去我们常说 Apple 在智能交互上「起大早(Siri)、赶晚集(Apple 智能)」。这种长期画饼却拿不出成绩的「AI 投入」,不仅消磨了用户的耐心,也影响着 Apple 投资人的信心。

从好的方面看,此次 WWDC26 展示的 Apple 智能已经「形成体系」,完成度已经非常高了;而在体验上,相比追逐模型参数和跑分成绩,Apple 也更希望把 AI 像 Face ID 一样融入日常体验。



Apple

但不可否认的是,Apple 在 AI 领域仍面临两大挑战:Apple 智能至今未能进入中国市场;且 AI 行业已经开始向更高级的自主 Agent 演进。前者需要 Apple 在短时间内走完全新 AFM 的本地合规化流程,后者需要 Apple 在短时间里「补齐」之前欠下的AI技术债。

很显然,这两个问题都需要更多时间才能解决,但现在Apple 最缺的就是时间——AI 行业技术日新月异,每天都有新模型、新 Agent、新 Skill 出现,AI 行业早已进入了「不进则退」的时代。

2026 年,Apple 暂且靠着「采购」的 Gemini 基础模型「勉强过关」。但难道之后每年 Apple 都要找 Google 买 Gemini 的底层模型吗?雷科技认为,从 WWDC26 看,「换心」手术解决了 Apple 智能的燃眉之急,但想在 AI 行业有所作为,展示苹果在硬件领域的王者风范,这家公司还有很长的路要走。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新