谷歌对自己开了一枪，逼死对手，先革己命！

IP属地中国·北京 星海情报局 时间：2026-05-20 20:19:02

出品 | 网易智能
作者 | 小小
编辑 | 王凤枝
Google I/O今日凌晨开幕，谷歌打了两枪。
第一枪，先打向自己。
谷歌把存在了25年的搜索框重写了。过去，搜索的核心是把用户带到网页；现在，AI直接住进搜索框里，替用户比价、追踪降价、生成仪表板，甚至跨商店统一结账。搜索不再只是给链接，而是直接办事。

这等于主动动摇自己的现金牛。搜索广告长期贡献Alphabet过半营收，但如果搜索从"给链接"变成"直接办事"，广告竞价和流量分发的逻辑都会被重新改写。可谷歌没得选。它不动手，Perplexity们会替它动。
第二枪，再打向对手。
Gemini 3.5 Flash的能力接近四个月前旗舰模型3.1 Pro的九成，速度快4倍，成本降到三分之一到一半。皮查伊在台上算了一笔账：一家每天跑1万亿token的企业，如果把八成工作负载切到这个模型上，一年能省10亿美元。

这话不是说给极客听的，而是说给企业CFO们听的。
回头看，这场I/O的核心不是"谷歌有没有发布最强模型"，而是它正在换战场：不再只拼谁更聪明，而是拼谁更便宜、谁更能干活、谁能无处不在地嵌进用户工作流。
至于谷歌亲手拆掉旧搜索之后，能不能立起一个新的AI入口，还要等几个月后的真实使用来验证。

搜索框里住了个"万事通"：
不仅会找，还会做
今年的Google I/O，谷歌从模型到应用全面出击。发布清单很长：Gemini 3.5 Flash模型、个人AI智能体Gemini Spark、Antigravity 2.0平台、翻新的Gemini应用、Flow创意工具升级、视频模型Gemini Omni(多模态输入输出+实时修改)、CodeMender安全智能体、智能体支付协议、第八代TPU芯片(TPU 8o/8i双架构)，以及1800亿至1900亿美元的年度资本支出计划。
在所有这些发布中，最激进的一刀砍向了自己：搜索业务迎来25年来最大改版。
新的搜索框被拉长了，以适应人们向聊天机器人提问时那种更复杂、更口语化的习惯。但形态变化是表层的。真正的变化在于：AI智能体直接住进了搜索框。
搜索不仅能找到信息，还能动手做事。你搜索一个概念，它能直接生成一段解释视频或动态图表，嵌入搜索结果中。谷歌在台上演示了一个关于黑洞的搜索，智能体实时生成了解释视频，直接放进结果页面。
皮查伊的说法是：新的信息智能体将全天候在后台工作，在正确时刻找到用户确切需要的东西，并帮助采取行动。借助Antigravity平台的编码能力，搜索能为用户的个性化问题构建自定义交互体验，视觉模拟、仪表板、跟踪器，都能按需生成。
一个名为"生成式UI"的功能将在今年夏天上线。它根据不同回复类型(视频、图片、新闻)在浏览器中实时创建自定义布局，让最相关的内容自动获得最合适的呈现方式。
谷歌高级副总裁尼克·福克斯(Nick Fox)说，搜索的目标是让你把脑海中任何问题直接扔进去，不用管格式对不对。"我们应该能够在人们对搜索能做什么的理解上拓宽他们的视野。"今年夏天信息智能体上线后，它们会7×24在后台监控网络，某款产品降价了、某个你感兴趣的新研究发布了，智能体会主动推送，甚至帮你预订。
购物体验的改变更为直观。谷歌将推出跨商家的"通用购物车"：浏览网页时把不同网站的心仪商品添加进去，智能体帮你跟踪价格变化、提示新品或新颜色。决定下单时，可以一次性结清分散在不同商店里的所有商品，使用谷歌的安全支付系统完成。当然，也可以选择回到原始零售商网站支付。
福克斯强调："我们非常致力于让搜索能够服务于全球数十亿用户。"付费订阅用户还能在搜索中开启自定义仪表板，用于管理婚礼策划或健身计划等长期任务。
几个数字：谷歌搜索中的AI模式月活已超10亿，自推出以来每季度查询量翻倍。AI概览功能拥有超过25亿月活。谷歌的五项核心服务(搜索、Gmail、Android、Chrome和YouTube)各自拥有超过30亿用户。

新模型不拼参数，
拼的是性价比
另一个硬核更新：Gemini 3.5 Flash。谷歌的目标很明确，打破模型越聪明就越慢、越贵的铁律。
根据谷歌内部测试及独立分析机构Artificial Analysis的数据，在编码和智能体等多项基准测试中，这款模型的性能已超过四个月前的旗舰模型Gemini 3.1 Pro。具体来看：编码和智能体任务测试Terminal-Bench 2.1得分76.2%；多模态理解测试CharXiv Reasoning达到84.2%；多模态评估MMU-Pro拿到84%的最高分，让谷歌模型包揽该榜单前两名。

智能体能力是Gemini系列历史上的短板。这次，3.5 Flash的GDPval-AA分数从Gemini 3 Flash的1204和3.1 Pro的1314跃升至1656，仅略低于GPT-5.4在最高设置下的1674分。幻觉率降至61%，比Gemini 3 Flash改善了31个百分点。

AI与软件工程师马克·克雷奇曼(Mark Kretschmann)在体验后指出，谷歌基本上是在说，Flash现在已经足够强大，可以用于真正的智能体编码工作，而不仅仅是廉价和快速的替代品。"Flash曾经意味着妥协。现在它开始看起来像是默认选择。"

但最大的卖点不是跑分。谷歌DeepMind首席技术官兼首席AI架构师科雷·卡武克库奥卢(Koray Kavukcuoglu)透露，团队开发了一个更极端的优化版本，在相同质量下比竞争对手的前沿模型快12倍。这个版本从周二起在Antigravity平台内提供。
几个硬指标：输出速度超过每秒280个token，比Gemini 3 Flash及多个竞品快约70%；智能指数得分55，与3.1 Pro并驾齐驱，强化了谷歌在平衡速度与智能方面的一贯优势。
规模方面：谷歌云上模型API每分钟处理约190亿个token；所有自有平台(搜索、Gemini应用、Workspace等)每月处理超过3200万亿个token，过去一年增长七倍。皮查伊透露，超过375家Google Cloud客户在过去12个月中每家使用了超过1万亿个token。
世界顶尖免疫学专家、AI研究者德里亚·乌努特马兹(Derya Unutmaz)看到3.5 Flash的跑分后评论：它在编码和代理基准中比3.1 Pro好得多，成本仅为一小部分。他迫不及待想看到3.5 Pro，认为这些升级"是一次变革性的进步"。

这个期待不无道理。谷歌确认3.5 Pro正在内部使用，下个月向公众推出。按照每六个月一次大更新的节奏，届时市场将看到又一次跃升。
但并非所有开发者买账。软件开发者艾哈迈德·阿尔内米(Ahmed AlNeaimy)在实际项目中测试后，用"BenchMaxed"来形容，认为模型被过度优化以在基准测试上刷高分，真实工作中却频繁出现幻觉、卡住或无限循环。
他说模型"甚至连一个任务都完不成"，完全不遵循指令。在他看来，"Flash"系列就是在用较低的智能换取速度，基准成绩与真实体验之间存在落差。他建议同行不要轻信跑分，直接用实际工作去检验。

Antigravity上的实战：
从杂乱代码库到自制游戏
基准测试是实验室里的体检报告。Antigravity平台上发生的事情更像真实的运动表现。
一个例子来自代码维护：有开发者把一个杂乱的遗留代码库丢给3.5 Flash，要求迁移到Next.js框架。3.5 Flash在Antigravity中自主完成了整个过程，一堆技术债变成了结构清晰的现代项目。

内容管理场景中，3.5 Flash能根据动态标准自动重命名和分类非结构化的资产文件。一个外表失控的文件库交给模型，它按内容类型、日期、关联项目自动归类，把杂乱的共享盘变成可检索的资产库。

谷歌还在AI Studio上展示了创意和设计场景的能力：把一篇研究论文交给3.5 Flash，它直接生成交互式动画来阐释核心概念，而不是返回文字摘要。把一段纯文本描述变成可交互的硬件模型，能旋转、能拆解的三维展示。

在一所学校的筹款活动策划中，3.5 Flash并行执行多个创意方案：Logo、海报、邀请函、社交媒体文案，一次性产出完整品牌方案。在产品设计环节，60秒为一个结账流程生成多种不同的用户体验方案，让设计师快速比较和筛选方向。

这种能力溢出到了消费者端。谷歌搜索利用3.5 Flash构建了一个解释Gyroid图案的交互式可视化页面。过去搜索这种抽象数学概念，结果是维基百科链接加几张静态示意图。现在智能体实时搭建三维模型，让用户在浏览器里旋转、缩放，直观理解这个复杂结构。

企业账单一年省10亿？
皮查伊算了一笔token账
速度优势最终体现在账单上。
皮查伊在发布会上算了一笔很具体的账："在谷歌云上，一家每天处理大约1万亿个token的企业，如果能将80%的工作负载从其他前沿模型迁移到Gemini 3.5 Flash上，一年可以节省超过10亿美元。"他还补了一刀："你们可能从CIO那里听过，有些公司才到五月份就已经用完了全年的AI token预算。"
这个数字背后是残酷的现实：AI智能体在执行多步骤任务时不断推理、调用工具、修改代码，消耗的token是简单问答的几十上百倍。3.5 Flash单价看起来比前代贵，但推理更强、处理复杂任务更高效，整体拥有成本反而显著下降。
卡武克库奥卢强调，谷歌主要模型更新的节奏大约是每六个月一次。一个每六个月就能以更低综合成本超越之前旗舰的模型，从根本上改变了企业AI投资的规划周期。
这一逻辑已在早期测试中得到验证。
Box CEO亚伦·列维(Aaron Levie)分享了测试结果，向Box AI Agent提供各行业的常见任务，给定一组相关文档。结果：金融服务准确率从73%升至81%，公共部门从59%升至76%，医疗保健从51%升至73%，生命科学从47%升至67%。列维的评价："持续的性能提升真是令人难以置信。"

沃顿商学院教授伊桑·莫里克(Ethan Mollick)提前体验后的感受：速度非常快，能力很强。他用它生成了一次性的程序化城镇，模型在过程中犯了一个错误，然后自己发现并纠正了它，这种自我纠错能力在复杂任务中尤为关键。

智能体指挥中心+AI私人管家
为了让企业更容易部署多智能体工作流，谷歌同步发布了Antigravity 2.0，一个独立的桌面应用，充当协调多个智能体的指挥中心。可以同时运行一个智能体编写网站、第二个生成品牌资产、第三个规划产品架构，所有智能体并行工作，单一界面管理。
Antigravity 2.0将谷歌内部工程师的token消耗量推到了每天3万亿个。皮查伊说，十周前这个数字还是0.5万亿，使用量"实际上每隔几周"就翻一番。这种规模创造了强大的反馈回路，模型团队能收集到大量真实世界信号，不断改进模型。
支撑这一切的是巨额基础设施。谷歌预计2026年资本支出约1800亿至1900亿美元，是四年前310亿美元的六倍。关键部分是第八代TPU芯片，首次采用训练和推理分离的双芯片架构(TPU 8o和TPU 8i)。配合Pathways系统，模型训练可以分布在多个数据中心，扩展到全球超过100万个TPU，目前世界上最大的训练集群。皮查伊说："这意味着在几周内训练更大、更有能力的模型，而不用几个月。"
基于这套既快又省的基础设施，谷歌正式推出了Gemini Spark，一个真正意义上的个人AI智能体。
它完全在谷歌云端运行。你关掉笔记本电脑、锁上手机，它也能在后台继续工作。负责该项目的谷歌副总裁乔什·伍德沃德(Josh Woodward)的形容一如既往："就像你把事情往身后一抛，Spark就会接住并完成工作。"

获得授权后，Spark可以连接Gmail、文档、幻灯片等工具。你可以设定重复任务：每月自动解析信用卡账单，标出新出现的订阅扣款。或者创建复杂工作流：去收件箱找出孩子学校发来的所有邮件，提取重要截止日期，整合成一份摘要，发送给你和你的伴侣。
它还能学习新技能。你正在计划一场活动，让它综合散落在邮件和聊天记录里的会议笔记，整理成一份谷歌文档，甚至起草后续沟通邮件。
安全方面，谷歌为它设定了严格边界：在执行花钱、发邮件等高影响操作前，Spark会先征求明确许可。伍德沃德将这种设计比作"给青少年他们的第一张借记卡"。谷歌还宣布了智能体支付协议：用户可设置品牌白名单、消费上限、指定商家等防护栏，智能体只能在框定范围内代表用户花钱。

剩下的事：
让AI变得好玩
除了处理事务的智能体，谷歌也没忘让AI变得好玩。
全新的视频生成模型Gemini Omni，能将文本、图片、视频等多种输入融合，输出电影级质量的视频。你给它一段走过金属雕塑的视频，说"把雕塑变成看起来像泡泡做的"，它就能直接修改视频中的现实。谷歌强调，Omni改进了物理效果的处理，重力、动能、流体动力学，这些正是区分"看起来像AI视频"和"看起来像真实镜头"的细节。每个Omni生成的视频都带有SynthID数字水印。

去年的Flow工具集也获得了新能力：一张旧照片，上传后根据人物、环境和气氛，一次性生成16个不同的视频片段。用钢琴弹一小段旋律，录下来交给Flow，它把草稿扩展成一首制作精良的歌曲。
Gemini应用做了一次彻底翻新。新的设计语言叫Neural Expressive：流畅动画、鲜艳色彩、新字体。麦克风重新设计，允许用户按自己的节奏讲述复杂想法，不会因为"嗯""那个"等自然停顿被打断。数据：Gemini应用月活突破9亿，覆盖230多个国家和地区，支持超过70种语言。一年前是4亿。
但并非所有企业用户都买账。健康营销公司Klick Health的执行副总裁西蒙·史密斯(Simon Smith)大会后表示，他的脑袋被谷歌的工具矩阵搞得"天旋地转"。他列出一串名字(Spark、Antigravity、AI Studio、Flow、Pomelli、Pics)正是谷歌在此次I/O上展示的不同产品入口。
他向OpenAI和Anthropic喊话，请求"避免过度扩散"，只给他一个能完成所有事情的强大智能体工具。但在他看来，真正的AGI不应该需要这么多界面。

结语：
两枪打完，效果还没出来
但也有人持保留态度。X用户TheQuantLord在大会后评论：整场I/O证实了一个判断，谷歌并没有引领AI，而是在迎头追赶。3.5 Flash、智能体间通信协议A2A、模型降价、搜索中嵌入智能体，每一条公告都能在其他厂商的动作中找到先例。"真正的故事不是谷歌宣布了什么，而是他们只是在跟随，而不是设定节奏。"

这场持续一个多小时的主题演讲，落点不在任何单一产品上，而在于谷歌正在构建的一套完整叙事：AI不再比拼单纯的参数，而是要成为在你背后持续运行的引擎。从搜索框到文档编辑器再到购物车，谷歌试图让AI智能体成为所有服务的默认层。
但两枪都是盲狙。
第一枪打向搜索广告，拆了旧的，新的能不能补上，没人知道。通用购物车和智能体订阅的营收，能不能填上广告流失的窟窿，要看接下来几个季度的财报。
第二枪打向对手，便宜到让你不换别家。但阿尔内米的实测提醒了一件事：跑分高不等于干活行。如果Flash在真实项目里频繁翻车，企业CFO省下的10亿美元可能是纸面上的。
谷歌这次没有在"谁最强"的擂台上继续打。它把竞争拖进了自己选的战场。至于这个战场是不是它以为的样子，过几个月才知道。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

2026中国互联网大会7月8日开幕

AI大模型跨越生产级“质变点”？|深度

2026全球数字经济大会|马斯克的机器人来京“路演”

「AI新世代」首轮30亿美元融资落定，可灵AI估值下调背后，视频大模型步入打硬仗阶段

“我一行代码都没读就发布了”，被OpenAI收购后，uv工具创始人开始反思AI编程

各大车企上半年KPI完成率

全站最新

比亚迪海豹长途实测：800公里后，电车跑高速的真实体验来了！

燃油车与新能源车怎么选？别盲目跟风，内行人教你按需做决定！

全新一代宝马X5 M60计划2027年登场 4.4T V8引擎动力强劲引期待

吉利银河TT官图亮相，双动力版本可选，或搭载千里浩瀚H7辅助驾驶方案

热门推荐

揭秘爸爸亲子活动猝死幼儿园

谷歌2025年AI用电量增37% 运营碳排放降2% 节能优化成效显著

港大教授领衔！忆生科技获数亿天使轮融资，打造机器人“大脑+小脑”记忆系统

2026中国互联网大会7月8日开幕

AI大模型跨越生产级“质变点”？|深度

美国AI成电诈人员"帮凶"？可同时和100多人聊天

2026全球数字经济大会|马斯克的机器人来京“路演”

「AI新世代」首轮30亿美元融资落定，可灵AI估值下调背后，视频大模型步入打硬仗阶段

“我一行代码都没读就发布了”，被OpenAI收购后，uv工具创始人开始反思AI编程

乘联分会崔东树：车船税调整是油电同权改革落地标志性一步

鸿蒙智行享界MPV新车谍照再曝，支持后轮转向

李飞飞、Jim Fan、徐丹飞联手，给具身智能指了一条新路

创维光伏在清远成立新公司

各大车企上半年KPI完成率

Meta也来卖铲子了！小扎：模型可以慢，GPU必须赚