当前位置: 首页 » 资讯 » 科技头条 » 正文

Gemini 3.5发布:谷歌用“价格砍半、速度4倍”逼竞争对手出局

IP属地 中国·北京 编辑:孙明 钛媒体 时间:2026-05-20 12:12:47

在今日举行的 Google I/O 2026 开发者大会上,Google CEO 桑达尔皮查伊(Sundar Pichai)走上台,发布了新一代大模型系列 Gemini 3.5

表面上,这是一次例行的大版本迭代。但把所有信息拼在一起——性能基准、定价策略、产品路线图、资本支出——你会发现,谷歌正在精心布局一场深层较量:用“前沿智能+极速推理+超低成本”三者合力,把智能体 AI 的门槛提高到竞争对手短期内难以跟进的高度。

性能与性价比:一次有备而来的反击

这场较量的序幕,在过去半年里已经拉开。

2025 年 1 月,OpenAI 推出 Operator,基于 CUA(Computer-Using Agent)模型,能够自主操控浏览器界面执行多步骤任务,率先向“行动式 AI”迈出实质性一步。2026 年 2 月,Anthropic 发布 Claude Opus 4.6,在智能体编程、计算机操控、工具调用等维度全面拉高行业基准;3 月,Anthropic 又密集推送 Claude Code 超过 10 个版本,加入 Computer Use、云端定时任务和远程控制,直接对标开发者的日常工作流。

也就是说,在 Gemini 3.5 发布之前,智能体 AI 的叙事主导权并不在谷歌手里。皮查伊今天的发布,是一次系统性的反击——而且是有备而来。

Gemini 3.5 系列首发推出 Gemini 3.5 Flash,定位为“迄今最强大的智能体与编程模型”。更强大的 Gemini 3.5 Pro 已在 Google 内部投入使用,皮查伊在台上透露,它“展现出极大的性能提升”,预计下月正式推出。

先说基准测试数据。这些数字如果不加解释,对大多数读者来说只是一串没有意义的符号——但它们实际上揭示了一个重要信号。

GDPval-AA 基准中,Gemini 3.5 Flash 取得 1656 Elo 评分。这个基准衡量的是“现实世界具有实际经济价值的编程任务”——换句话说,不是做题,而是写能用的代码、解决真实的工程问题。1656 Elo 的分数,超过了 Gemini 3.1 Pro,也超过了目前公开可查的大部分前沿模型成绩。

Terminal-Bench 2.1(衡量 AI 在真实终端环境中完成复杂任务的能力)中,Gemini 3.5 Flash 得分 76.2%。作为参照,2025 年初 OpenAI Operator 发布时,同类基准的成绩普遍在 50%–60% 区间。半年多过去,76.2% 意味着智能体在执行真实任务时的可靠性,正在从“勉强可用”向“可以依赖”跨越。

在智能体工具调用基准 MCP Atlas 中,成绩是 83.6%;多模态推理基准 CharXiv Reasoning 录得 84.2%。在 Artificial Analysis 综合智能指数中,Gemini 3.5 Flash 稳居第一象限的右上方——即同时具备前沿级智能水平与极高推理速度的最优区间,而且是目前唯一稳居这个区间的公开模型。

但真正让这次发布最具冲击力的,不是基准测试,而是性价比。

Gemini 3.5 Flash 的输出 Token 速率达到其他前沿模型的 4 倍。在 Antigravity 平台内置的优化版本中,响应速度更达到竞品的 12 倍

成本方面,处理智能体任务的费用通常不到其他前沿模型的 一半。据谷歌测算,头部科技企业若将 80% 的日常负载从其他前沿模型迁移至 Gemini 3.5 Flash,每年可节省超过 10 亿美元

皮查伊在演讲中直言:“Flash 的惊人之处在于,它以不到同类前沿模型一半的价格,提供了前沿级别的能力。”

这句话值得停下来想一想。当一家巨头愿意用“砍半定价”来推广自己的最前沿模型时,它传达的信号不是“我在让利”,而是“我要把竞争对手挤出市场”。低价是手段,抢占生态才是目的。

这些数据并非纸上谈兵。

Google 内部 AI 编程工具形成了强大数据反馈闭环:从 2025 年 3 月每天处理 5000 亿 Token,到 I/O 2026 时已增长至每天处理超过 3 万亿 Token。规模翻倍仅用数周,而这种大规模真实负载的持续打磨,正是 Gemini 3.5 性能跃升的重要基石。

这里有一个值得注意的细节:谷歌没有披露 Gemini 3.5 的参数量。在行业里,这通常意味着两种可能——要么参数规模并没有大幅提升,靠的是工程优化和推理架构改进;要么谷歌有意隐瞒,避免给竞争对手提供对标参考。无论哪种情况,对外部开发者和企业来说,“参数黑盒”都是一个需要留心的信号。

Gemini 3.5 之所以被称为“智能体时代的基础模型”,核心在于它是 Google 首款将前沿智能与行动力深度融合的模型系列。

所谓“智能体”(Agent),简单说就是能自主规划、调用工具、执行多步骤任务的人工智能——不再只是回答问题,而是替你完成任务。Gemini 3.5 的智能体原生架构支持同时部署多个互联协作的子智能体(subagents),大规模并行处理复杂业务场景,将原本需要数天乃至数周的长周期工作压缩至极短时间完成。

它能够稳定执行跨步骤、跨工具的复杂任务流程,并在整个过程中保持上下文连贯性,支持运行数周的自主工作流——如税务申报、客户尽调等场景——无需人工持续介入。这意味着,智能体 AI 正在从“演示阶段”走向“生产阶段”,而 Gemini 3.5 是目前门槛最低、最易上手的选择。

编程能力的跨越式飞跃是另一大核心亮点。

Gemini 3.5 Flash 在 GDPVal 评分中表现突出,具体能力涵盖从零构建全新应用、维护与迭代大型代码库、遗留代码迁移(如迁移至 Next.js 等现代框架),以及快速规划与迭代开发。

这里有一个值得对照的背景:2026 年以来,AI 编程助手的市场竞争已经进入白热化阶段。GitHub Copilot、Cursor、Windsurf 等工具背后,分别绑定了 OpenAI、Anthropic 和 Google 的模型能力。Gemini 3.5 Flash 如果真的如基准测试所示在编程任务上大幅领先,那么谷歌不仅在模型层面对竞争对手形成压力,在开发者工具生态层面也将获得更大的话语权。

多模态能力同样进一步升级。

基于 Gemini 3 的原生多模态基础构建,Gemini 3.5 能够生成更丰富、更具交互性的 Web UI 和图形界面(生成式 UI),对超过 100 页的复杂文件进行深度推理与信息检索。

它通过多模态 OCR 结合历史数据模式推理与复杂账单图像理解——这个能力听起来技术化,但实际场景非常具体:比如企业财务部门处理上千张供应商发票,过去需要人工逐一核对,现在可以由 AI 自主完成,且准确率在企业级场景中已经通过验证。

安全方面的升级,谷歌着墨不少,但外界的疑问也最多。

Gemini 3.5 基于 Google 前沿安全框架(Frontier Safety Framework) 开发,强化了网络安全与 CBRN(化学、生物、放射、核)防护措施,并引入可解释性工具——在 AI 给出最终回答前对其内部推理逻辑进行安全检查,在显著降低有害内容生成概率的同时,减少对合法查询的误拒率。

这里存在一个值得追问的矛盾:谷歌强调“可解释性”和“安全第一”,但与此同时,Gemini 3.5 正在大幅降低 AI 能力的获取门槛(速度更快、价格更低、全面开放 API)。门槛越低,被滥用的风险越高。谷歌的安全框架是否真能覆盖一个 Token 处理量达到 3.2 千万亿/月的开放生态?这个问题,皮查伊在台上没有回答。

皮查伊的全栈叙事:从模型到生态

皮查伊在 I/O 2026 主题演讲中的发言,是理解这次发布的关键。

他首先回顾了过去一年的进展:“自去年 I/O 以来,这是一段非凡的历程——持续的产品发布、技术突破和超高速进展。我们现在处于 AI 周期的一个阶段:人们希望在他们每天使用的产品中看到真正的价值。”

这句话的潜台词是:过去两年 AI 行业都在跑分、发论文、做演示,现在到了交成绩单的时候了。而谷歌的成绩单,就是搜索、Gemini App、Android 这几十亿用户产品的 AI 化改造。

关于搜索业务的演进,皮查伊说了一句分量很重的话:“如果我们从 27 年的搜索研发中学到了什么,那就是:延迟至关重要。”

这句话解释了为何 Gemini 3.5 在速度上的突破被谷歌置于如此核心的位置。在搜索这个亿级用户产品里,延迟直接决定用户体验与留存。这也是为什么“4 倍速度”不是一个技术指标,而是一个产品战略:只有足够快,AI 搜索才有可能替代传统搜索,成为用户的主流选择。

皮查伊透露,搭载 AI 功能的搜索功能正在改变用户行为——搜索已不再只是单次查询,而更像是一次持续的对话,而当人们在搜索中使用 AI 驱动的功能时,他们使用搜索的频率更高了。这对谷歌来说是一个极其重要的信号:AI 功能不是蚕食搜索的现有流量,而是在创造新的使用场景和更高的使用频次。

对于智能体时代的战略判断,皮查伊的表态更加明确:“我们正超级专注于将智能体的力量,安全、可靠地带给消费者,让它为每个人服务。”

这句话的野心比听起来大得多。

“为每个人服务”意味着谷歌不仅要占领企业市场,还要占领消费级市场。而要实现这一点,光有模型不够,必须有全栈能力:芯片(TPU 8)、模型(Gemini 3.5)、平台(Antigravity 2.0)、终端产品(Spark、搜索、Android)。皮查伊在演讲中勾勒的正是这条完整的技术栈路径。

这条全栈路径的核心逻辑是:以极致性价比与极速推理,驱动智能体在消费端和企业端的规模化落地。而这,恰恰是 OpenAI 没有芯片、Anthropic 没有终端产品、Meta 没有企业级全栈的竞争对手们短期内难以复制的壁垒。

基于上述战略框架,皮查伊公布了多项即将落地的关键产品。

Gemini Spark——基于 Gemini 3.5 Flash 与 Antigravity 平台驱动的个人 AI 智能体——将在下周向美国 Google AI Ultra 订阅用户开放 Beta。它能够 24/7 运行,处理长周期复杂任务,并通过 MCP 协议接入第三方工具。这意味着,Spark 不是一个封闭在谷歌生态里的助手,而是一个可以连接外部服务的开放智能体——这个设计选择,明显是在对标 OpenAI 的插件生态。

搜索信息智能体将于 2026 年夏季推出,在后台 24/7 运行,主动发现信息并代为执行操作。Daily Brief Agent 将整合用户的邮件、日历与任务,生成个性化晨间摘要。Android Halo 将于 2026 年晚些时候推出,为用户提供实时智能体任务追踪界面。搭载 AI 功能的音频眼镜硬件产品则定于 2026 年秋季发布。

而更强大的 Gemini 3.5 Pro,皮查伊透露“已在 Google 内部使用,展现出极大的性能提升”,预计下月正式推出。Pro 版的发布,将直接与 OpenAI 的 GPT 系列和 Anthropic 的 Claude Opus 系列展开正面竞争。

这些产品构想是否靠谱,一个重要的验证维度是:企业客户有没有真的在用、真的在付钱?

谷歌在发布会上列举了多家企业客户的使用案例。但需要指出的是,这些案例均为谷歌主动披露,第三方独立验证数据尚待观察。不过从已披露的信息来看,应用场景确实覆盖了企业 AI 化的核心痛点。

Shopify 利用并行多子智能体分析长周期复杂数据,体现多智能体协作能力;麦格理银行借助 Gemini 3.5 加速客户开户流程,能够对 100 页以上的复杂文件进行推理并给出合规建议——这个场景如果真的跑通,对金融行业的 AI 落地将是一个重要信号;Salesforce(Agentforce) 依托其跨步骤工具调用能力自动化企业任务;Ramp 应用其多模态 OCR 能力处理复杂账单;Xero 让其自主管理数周的 workflows(如 1099 税务表格处理);Databricks 则利用其海量数据集推理能力进行实时监测。

把这些案例放在一起,一个共同的规律浮现出来:Gemini 3.5 的企业价值,不在于“更聪明”,而在于“更持久、更快速、更便宜地执行长周期任务”。这正是智能体 AI 从演示走向生产的关键门槛。

从生态集成的角度看,Gemini 3.5 Flash 即日起已在多个层面全面开放。

消费端作为 Gemini App 和 Google 搜索 AI 模式的全球默认模型;开发者端通过 Google AI Studio、Gemini API 和 Android Studio 提供服务;企业端则通过 Gemini Enterprise Agent Platform 支持部署。

这种全栈覆盖的开放策略,与皮查伊所强调的“让智能体的力量为每个人服务”形成了战略呼应。但与此同时,一个值得警惕的问题是:当谷歌同时控制了模型、平台、开发工具和终端产品时,开发者和其他企业是否正在被逐步锁定在谷歌的生态系统里?“开放 API”和“开放生态”之间,并不总是等号。

规模即壁垒:1800 亿美元背后的逻辑

支撑这一切的,是 Google AI 全栈持续释放的规模势能。

皮查伊在演讲中披露的最新数据显示:月度 Token 处理量已达到 3.2 千万亿(quadrillion),同比增长 7 倍。这个数字意味着,谷歌的 AI 基础设施正在以远超行业平均的速度扩张。

Gemini App 月活跃用户从 4 亿增长至 9 亿,一年内实现翻倍;搜索 AI 模式月活跃用户突破 10 亿;AI Overviews 月活跃用户达到 25 亿;基于 Google 模型进行开发的开发者达到 850 万/月

而最震撼的数字或许是这一个:2026 年预计资本支出高达 1800 至 1900 亿美元,较 2022 年的约 310 亿美元大幅增长。

这 1800 多亿美元的资本支出,本质上是在做一件事:用基础设施的规模化优势,把竞争对手挤出市场。当你的 TPU 集群规模、Token 处理量和用户基数都达到竞争对手无法匹敌的量级时,“速度 4 倍、价格砍半”就不再是一个促销手段,而是一个结构性壁垒。

回到最根本的问题:Gemini 3.5 的发布,究竟是一次真正的技术飞跃,还是一次精心包装的战略营销?

答案可能是:两者都是。

从技术角度看,Gemini 3.5 Flash 在基准测试中的表现、推理速度的提升、以及多智能体并行架构的落地,都是真实的进步。但与此同时,这次发布真正值得关注的,不是模型本身,而是谷歌围绕模型构建的全栈壁垒:TPU 8 提供算力、Gemini 3.5 提供智能、Antigravity 2.0 提供平台、Spark 和搜索提供触达——这条链条上的每一个环节,谷歌都握有主动权。

对开发者和企业来说,这意味着选择 Gemini 3.5 不仅是选择一个模型,更是选择一个生态。而对 OpenAI、Anthropic 和 Meta 来说,Gemini 3.5 的发布传递的信息很明确:单靠模型能力已经不够了,谁能把模型、平台和产品连成一体,谁才能赢得智能体时代。

正如皮查伊在演讲结尾所言:“当我们放眼整个创新技术栈,可以清晰地看到——我们正坚定地步入智能体化的 Gemini 时代。”

这句话是宣言,也是向竞争对手发出的挑战。(本文首发钛媒体APP,作者 | 硅谷Tech_news,编辑 | 秦聪慧)

标签: 智能 谷歌 模型 任务 能力 皮查伊 企业 工具 产品 竞争对手 基准 全栈 开发者 生态 编程 场景 用户 客户 速度 战略 功能 平台 数据 步骤 规模 核心 行业 价格 性能 作者 路径 层面

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。