![]()
出品 | 网易智能
作者 | 小小
编辑 | 王凤枝
Google I/O今日凌晨开幕,谷歌打了两枪。
第一枪,先打向自己。
谷歌把存在了25年的搜索框重写了。过去,搜索的核心是把用户带到网页;现在,AI直接住进搜索框里,替用户比价、追踪降价、生成仪表板,甚至跨商店统一结账。搜索不再只是给链接,而是直接办事。
![]()
这等于主动动摇自己的现金牛。搜索广告长期贡献Alphabet过半营收,但如果搜索从"给链接"变成"直接办事",广告竞价和流量分发的逻辑都会被重新改写。可谷歌没得选。它不动手,Perplexity们会替它动。
第二枪,再打向对手。
Gemini 3.5 Flash的能力接近四个月前旗舰模型3.1 Pro的九成,速度快4倍,成本降到三分之一到一半。皮查伊在台上算了一笔账:一家每天跑1万亿token的企业,如果把八成工作负载切到这个模型上,一年能省10亿美元。
![]()
这话不是说给极客听的,而是说给企业CFO们听的。
回头看,这场I/O的核心不是"谷歌有没有发布最强模型",而是它正在换战场:不再只拼谁更聪明,而是拼谁更便宜、谁更能干活、谁能无处不在地嵌进用户工作流。
至于谷歌亲手拆掉旧搜索之后,能不能立起一个新的AI入口,还要等几个月后的真实使用来验证。
![]()
搜索框里住了个"万事通":
不仅会找,还会做
今年的Google I/O,谷歌从模型到应用全面出击。发布清单很长:Gemini 3.5 Flash模型、个人AI智能体Gemini Spark、Antigravity 2.0平台、翻新的Gemini应用、Flow创意工具升级、视频模型Gemini Omni(多模态输入输出+实时修改)、CodeMender安全智能体、智能体支付协议、第八代TPU芯片(TPU 8o/8i双架构),以及1800亿至1900亿美元的年度资本支出计划。
在所有这些发布中,最激进的一刀砍向了自己:搜索业务迎来25年来最大改版。
新的搜索框被拉长了,以适应人们向聊天机器人提问时那种更复杂、更口语化的习惯。但形态变化是表层的。真正的变化在于:AI智能体直接住进了搜索框。
搜索不仅能找到信息,还能动手做事。你搜索一个概念,它能直接生成一段解释视频或动态图表,嵌入搜索结果中。谷歌在台上演示了一个关于黑洞的搜索,智能体实时生成了解释视频,直接放进结果页面。
皮查伊的说法是:新的信息智能体将全天候在后台工作,在正确时刻找到用户确切需要的东西,并帮助采取行动。借助Antigravity平台的编码能力,搜索能为用户的个性化问题构建自定义交互体验,视觉模拟、仪表板、跟踪器,都能按需生成。
一个名为"生成式UI"的功能将在今年夏天上线。它根据不同回复类型(视频、图片、新闻)在浏览器中实时创建自定义布局,让最相关的内容自动获得最合适的呈现方式。
谷歌高级副总裁尼克·福克斯(Nick Fox)说,搜索的目标是让你把脑海中任何问题直接扔进去,不用管格式对不对。"我们应该能够在人们对搜索能做什么的理解上拓宽他们的视野。"今年夏天信息智能体上线后,它们会7×24在后台监控网络,某款产品降价了、某个你感兴趣的新研究发布了,智能体会主动推送,甚至帮你预订。
购物体验的改变更为直观。谷歌将推出跨商家的"通用购物车":浏览网页时把不同网站的心仪商品添加进去,智能体帮你跟踪价格变化、提示新品或新颜色。决定下单时,可以一次性结清分散在不同商店里的所有商品,使用谷歌的安全支付系统完成。当然,也可以选择回到原始零售商网站支付。
福克斯强调:"我们非常致力于让搜索能够服务于全球数十亿用户。"付费订阅用户还能在搜索中开启自定义仪表板,用于管理婚礼策划或健身计划等长期任务。
几个数字:谷歌搜索中的AI模式月活已超10亿,自推出以来每季度查询量翻倍。AI概览功能拥有超过25亿月活。谷歌的五项核心服务(搜索、Gmail、Android、Chrome和YouTube)各自拥有超过30亿用户。
![]()
新模型不拼参数,
拼的是性价比
另一个硬核更新:Gemini 3.5 Flash。谷歌的目标很明确,打破模型越聪明就越慢、越贵的铁律。
根据谷歌内部测试及独立分析机构Artificial Analysis的数据,在编码和智能体等多项基准测试中,这款模型的性能已超过四个月前的旗舰模型Gemini 3.1 Pro。具体来看:编码和智能体任务测试Terminal-Bench 2.1得分76.2%;多模态理解测试CharXiv Reasoning达到84.2%;多模态评估MMU-Pro拿到84%的最高分,让谷歌模型包揽该榜单前两名。
![]()
智能体能力是Gemini系列历史上的短板。这次,3.5 Flash的GDPval-AA分数从Gemini 3 Flash的1204和3.1 Pro的1314跃升至1656,仅略低于GPT-5.4在最高设置下的1674分。幻觉率降至61%,比Gemini 3 Flash改善了31个百分点。
![]()
AI与软件工程师马克·克雷奇曼(Mark Kretschmann)在体验后指出,谷歌基本上是在说,Flash现在已经足够强大,可以用于真正的智能体编码工作,而不仅仅是廉价和快速的替代品。"Flash曾经意味着妥协。现在它开始看起来像是默认选择。"
![]()
但最大的卖点不是跑分。谷歌DeepMind首席技术官兼首席AI架构师科雷·卡武克库奥卢(Koray Kavukcuoglu)透露,团队开发了一个更极端的优化版本,在相同质量下比竞争对手的前沿模型快12倍。这个版本从周二起在Antigravity平台内提供。
几个硬指标:输出速度超过每秒280个token,比Gemini 3 Flash及多个竞品快约70%;智能指数得分55,与3.1 Pro并驾齐驱,强化了谷歌在平衡速度与智能方面的一贯优势。
规模方面:谷歌云上模型API每分钟处理约190亿个token;所有自有平台(搜索、Gemini应用、Workspace等)每月处理超过3200万亿个token,过去一年增长七倍。皮查伊透露,超过375家Google Cloud客户在过去12个月中每家使用了超过1万亿个token。
世界顶尖免疫学专家、AI研究者德里亚·乌努特马兹(Derya Unutmaz)看到3.5 Flash的跑分后评论:它在编码和代理基准中比3.1 Pro好得多,成本仅为一小部分。他迫不及待想看到3.5 Pro,认为这些升级"是一次变革性的进步"。
![]()
这个期待不无道理。谷歌确认3.5 Pro正在内部使用,下个月向公众推出。按照每六个月一次大更新的节奏,届时市场将看到又一次跃升。
但并非所有开发者买账。软件开发者艾哈迈德·阿尔内米(Ahmed AlNeaimy)在实际项目中测试后,用"BenchMaxed"来形容,认为模型被过度优化以在基准测试上刷高分,真实工作中却频繁出现幻觉、卡住或无限循环。
他说模型"甚至连一个任务都完不成",完全不遵循指令。在他看来,"Flash"系列就是在用较低的智能换取速度,基准成绩与真实体验之间存在落差。他建议同行不要轻信跑分,直接用实际工作去检验。
![]()
![]()
Antigravity上的实战:
从杂乱代码库到自制游戏
基准测试是实验室里的体检报告。Antigravity平台上发生的事情更像真实的运动表现。
一个例子来自代码维护:有开发者把一个杂乱的遗留代码库丢给3.5 Flash,要求迁移到Next.js框架。3.5 Flash在Antigravity中自主完成了整个过程,一堆技术债变成了结构清晰的现代项目。
![]()
内容管理场景中,3.5 Flash能根据动态标准自动重命名和分类非结构化的资产文件。一个外表失控的文件库交给模型,它按内容类型、日期、关联项目自动归类,把杂乱的共享盘变成可检索的资产库。
![]()
谷歌还在AI Studio上展示了创意和设计场景的能力:把一篇研究论文交给3.5 Flash,它直接生成交互式动画来阐释核心概念,而不是返回文字摘要。把一段纯文本描述变成可交互的硬件模型,能旋转、能拆解的三维展示。
![]()
在一所学校的筹款活动策划中,3.5 Flash并行执行多个创意方案:Logo、海报、邀请函、社交媒体文案,一次性产出完整品牌方案。在产品设计环节,60秒为一个结账流程生成多种不同的用户体验方案,让设计师快速比较和筛选方向。
![]()
这种能力溢出到了消费者端。谷歌搜索利用3.5 Flash构建了一个解释Gyroid图案的交互式可视化页面。过去搜索这种抽象数学概念,结果是维基百科链接加几张静态示意图。现在智能体实时搭建三维模型,让用户在浏览器里旋转、缩放,直观理解这个复杂结构。
![]()
企业账单一年省10亿?
皮查伊算了一笔token账
速度优势最终体现在账单上。
皮查伊在发布会上算了一笔很具体的账:"在谷歌云上,一家每天处理大约1万亿个token的企业,如果能将80%的工作负载从其他前沿模型迁移到Gemini 3.5 Flash上,一年可以节省超过10亿美元。"他还补了一刀:"你们可能从CIO那里听过,有些公司才到五月份就已经用完了全年的AI token预算。"
这个数字背后是残酷的现实:AI智能体在执行多步骤任务时不断推理、调用工具、修改代码,消耗的token是简单问答的几十上百倍。3.5 Flash单价看起来比前代贵,但推理更强、处理复杂任务更高效,整体拥有成本反而显著下降。
卡武克库奥卢强调,谷歌主要模型更新的节奏大约是每六个月一次。一个每六个月就能以更低综合成本超越之前旗舰的模型,从根本上改变了企业AI投资的规划周期。
这一逻辑已在早期测试中得到验证。
Box CEO亚伦·列维(Aaron Levie)分享了测试结果,向Box AI Agent提供各行业的常见任务,给定一组相关文档。结果:金融服务准确率从73%升至81%,公共部门从59%升至76%,医疗保健从51%升至73%,生命科学从47%升至67%。列维的评价:"持续的性能提升真是令人难以置信。"
![]()
沃顿商学院教授伊桑·莫里克(Ethan Mollick)提前体验后的感受:速度非常快,能力很强。他用它生成了一次性的程序化城镇,模型在过程中犯了一个错误,然后自己发现并纠正了它,这种自我纠错能力在复杂任务中尤为关键。
![]()
![]()
智能体指挥中心+AI私人管家
为了让企业更容易部署多智能体工作流,谷歌同步发布了Antigravity 2.0,一个独立的桌面应用,充当协调多个智能体的指挥中心。可以同时运行一个智能体编写网站、第二个生成品牌资产、第三个规划产品架构,所有智能体并行工作,单一界面管理。
Antigravity 2.0将谷歌内部工程师的token消耗量推到了每天3万亿个。皮查伊说,十周前这个数字还是0.5万亿,使用量"实际上每隔几周"就翻一番。这种规模创造了强大的反馈回路,模型团队能收集到大量真实世界信号,不断改进模型。
支撑这一切的是巨额基础设施。谷歌预计2026年资本支出约1800亿至1900亿美元,是四年前310亿美元的六倍。关键部分是第八代TPU芯片,首次采用训练和推理分离的双芯片架构(TPU 8o和TPU 8i)。配合Pathways系统,模型训练可以分布在多个数据中心,扩展到全球超过100万个TPU,目前世界上最大的训练集群。皮查伊说:"这意味着在几周内训练更大、更有能力的模型,而不用几个月。"
基于这套既快又省的基础设施,谷歌正式推出了Gemini Spark,一个真正意义上的个人AI智能体。
它完全在谷歌云端运行。你关掉笔记本电脑、锁上手机,它也能在后台继续工作。负责该项目的谷歌副总裁乔什·伍德沃德(Josh Woodward)的形容一如既往:"就像你把事情往身后一抛,Spark就会接住并完成工作。"
![]()
获得授权后,Spark可以连接Gmail、文档、幻灯片等工具。你可以设定重复任务:每月自动解析信用卡账单,标出新出现的订阅扣款。或者创建复杂工作流:去收件箱找出孩子学校发来的所有邮件,提取重要截止日期,整合成一份摘要,发送给你和你的伴侣。
它还能学习新技能。你正在计划一场活动,让它综合散落在邮件和聊天记录里的会议笔记,整理成一份谷歌文档,甚至起草后续沟通邮件。
安全方面,谷歌为它设定了严格边界:在执行花钱、发邮件等高影响操作前,Spark会先征求明确许可。伍德沃德将这种设计比作"给青少年他们的第一张借记卡"。谷歌还宣布了智能体支付协议:用户可设置品牌白名单、消费上限、指定商家等防护栏,智能体只能在框定范围内代表用户花钱。
![]()
剩下的事:
让AI变得好玩
除了处理事务的智能体,谷歌也没忘让AI变得好玩。
全新的视频生成模型Gemini Omni,能将文本、图片、视频等多种输入融合,输出电影级质量的视频。你给它一段走过金属雕塑的视频,说"把雕塑变成看起来像泡泡做的",它就能直接修改视频中的现实。谷歌强调,Omni改进了物理效果的处理,重力、动能、流体动力学,这些正是区分"看起来像AI视频"和"看起来像真实镜头"的细节。每个Omni生成的视频都带有SynthID数字水印。
![]()
去年的Flow工具集也获得了新能力:一张旧照片,上传后根据人物、环境和气氛,一次性生成16个不同的视频片段。用钢琴弹一小段旋律,录下来交给Flow,它把草稿扩展成一首制作精良的歌曲。
Gemini应用做了一次彻底翻新。新的设计语言叫Neural Expressive:流畅动画、鲜艳色彩、新字体。麦克风重新设计,允许用户按自己的节奏讲述复杂想法,不会因为"嗯""那个"等自然停顿被打断。数据:Gemini应用月活突破9亿,覆盖230多个国家和地区,支持超过70种语言。一年前是4亿。
但并非所有企业用户都买账。健康营销公司Klick Health的执行副总裁西蒙·史密斯(Simon Smith)大会后表示,他的脑袋被谷歌的工具矩阵搞得"天旋地转"。他列出一串名字(Spark、Antigravity、AI Studio、Flow、Pomelli、Pics)正是谷歌在此次I/O上展示的不同产品入口。
他向OpenAI和Anthropic喊话,请求"避免过度扩散",只给他一个能完成所有事情的强大智能体工具。但在他看来,真正的AGI不应该需要这么多界面。
![]()
![]()
结语:
两枪打完,效果还没出来
但也有人持保留态度。X用户TheQuantLord在大会后评论:整场I/O证实了一个判断,谷歌并没有引领AI,而是在迎头追赶。3.5 Flash、智能体间通信协议A2A、模型降价、搜索中嵌入智能体,每一条公告都能在其他厂商的动作中找到先例。"真正的故事不是谷歌宣布了什么,而是他们只是在跟随,而不是设定节奏。"
![]()
这场持续一个多小时的主题演讲,落点不在任何单一产品上,而在于谷歌正在构建的一套完整叙事:AI不再比拼单纯的参数,而是要成为在你背后持续运行的引擎。从搜索框到文档编辑器再到购物车,谷歌试图让AI智能体成为所有服务的默认层。
但两枪都是盲狙。
第一枪打向搜索广告,拆了旧的,新的能不能补上,没人知道。通用购物车和智能体订阅的营收,能不能填上广告流失的窟窿,要看接下来几个季度的财报。
第二枪打向对手,便宜到让你不换别家。但阿尔内米的实测提醒了一件事:跑分高不等于干活行。如果Flash在真实项目里频繁翻车,企业CFO省下的10亿美元可能是纸面上的。
谷歌这次没有在"谁最强"的擂台上继续打。它把竞争拖进了自己选的战场。至于这个战场是不是它以为的样子,过几个月才知道。





京公网安备 11011402013531号