Gemini 3.5发布：谷歌用“价格砍半、速度4倍”逼竞争对手出局

IP属地中国·北京 编辑：孙明钛媒体 时间：2026-05-20 12:12:47

在今日举行的 Google I/O 2026 开发者大会上，Google CEO 桑达尔皮查伊（Sundar Pichai）走上台，发布了新一代大模型系列 Gemini 3.5。
表面上，这是一次例行的大版本迭代。但把所有信息拼在一起——性能基准、定价策略、产品路线图、资本支出——你会发现，谷歌正在精心布局一场深层较量：用“前沿智能+极速推理+超低成本”三者合力，把智能体 AI 的门槛提高到竞争对手短期内难以跟进的高度。
性能与性价比：一次有备而来的反击
这场较量的序幕，在过去半年里已经拉开。
2025 年 1 月，OpenAI 推出 Operator，基于 CUA（Computer-Using Agent）模型，能够自主操控浏览器界面执行多步骤任务，率先向“行动式 AI”迈出实质性一步。2026 年 2 月，Anthropic 发布 Claude Opus 4.6，在智能体编程、计算机操控、工具调用等维度全面拉高行业基准；3 月，Anthropic 又密集推送 Claude Code 超过 10 个版本，加入 Computer Use、云端定时任务和远程控制，直接对标开发者的日常工作流。
也就是说，在 Gemini 3.5 发布之前，智能体 AI 的叙事主导权并不在谷歌手里。皮查伊今天的发布，是一次系统性的反击——而且是有备而来。
Gemini 3.5 系列首发推出 Gemini 3.5 Flash，定位为“迄今最强大的智能体与编程模型”。更强大的 Gemini 3.5 Pro 已在 Google 内部投入使用，皮查伊在台上透露，它“展现出极大的性能提升”，预计下月正式推出。
先说基准测试数据。这些数字如果不加解释，对大多数读者来说只是一串没有意义的符号——但它们实际上揭示了一个重要信号。
在 GDPval-AA 基准中，Gemini 3.5 Flash 取得 1656 Elo 评分。这个基准衡量的是“现实世界具有实际经济价值的编程任务”——换句话说，不是做题，而是写能用的代码、解决真实的工程问题。1656 Elo 的分数，超过了 Gemini 3.1 Pro，也超过了目前公开可查的大部分前沿模型成绩。
在 Terminal-Bench 2.1（衡量 AI 在真实终端环境中完成复杂任务的能力）中，Gemini 3.5 Flash 得分 76.2%。作为参照，2025 年初 OpenAI Operator 发布时，同类基准的成绩普遍在 50%–60% 区间。半年多过去，76.2% 意味着智能体在执行真实任务时的可靠性，正在从“勉强可用”向“可以依赖”跨越。
在智能体工具调用基准 MCP Atlas 中，成绩是 83.6%；多模态推理基准 CharXiv Reasoning 录得 84.2%。在 Artificial Analysis 综合智能指数中，Gemini 3.5 Flash 稳居第一象限的右上方——即同时具备前沿级智能水平与极高推理速度的最优区间，而且是目前唯一稳居这个区间的公开模型。
但真正让这次发布最具冲击力的，不是基准测试，而是性价比。
Gemini 3.5 Flash 的输出 Token 速率达到其他前沿模型的 4 倍。在 Antigravity 平台内置的优化版本中，响应速度更达到竞品的 12 倍。
成本方面，处理智能体任务的费用通常不到其他前沿模型的一半。据谷歌测算，头部科技企业若将 80% 的日常负载从其他前沿模型迁移至 Gemini 3.5 Flash，每年可节省超过 10 亿美元。
皮查伊在演讲中直言：“Flash 的惊人之处在于，它以不到同类前沿模型一半的价格，提供了前沿级别的能力。”
这句话值得停下来想一想。当一家巨头愿意用“砍半定价”来推广自己的最前沿模型时，它传达的信号不是“我在让利”，而是“我要把竞争对手挤出市场”。低价是手段，抢占生态才是目的。
这些数据并非纸上谈兵。
Google 内部 AI 编程工具形成了强大数据反馈闭环：从 2025 年 3 月每天处理 5000 亿 Token，到 I/O 2026 时已增长至每天处理超过 3 万亿 Token。规模翻倍仅用数周，而这种大规模真实负载的持续打磨，正是 Gemini 3.5 性能跃升的重要基石。
这里有一个值得注意的细节：谷歌没有披露 Gemini 3.5 的参数量。在行业里，这通常意味着两种可能——要么参数规模并没有大幅提升，靠的是工程优化和推理架构改进；要么谷歌有意隐瞒，避免给竞争对手提供对标参考。无论哪种情况，对外部开发者和企业来说，“参数黑盒”都是一个需要留心的信号。
Gemini 3.5 之所以被称为“智能体时代的基础模型”，核心在于它是 Google 首款将前沿智能与行动力深度融合的模型系列。
所谓“智能体”（Agent），简单说就是能自主规划、调用工具、执行多步骤任务的人工智能——不再只是回答问题，而是替你完成任务。Gemini 3.5 的智能体原生架构支持同时部署多个互联协作的子智能体（subagents），大规模并行处理复杂业务场景，将原本需要数天乃至数周的长周期工作压缩至极短时间完成。
它能够稳定执行跨步骤、跨工具的复杂任务流程，并在整个过程中保持上下文连贯性，支持运行数周的自主工作流——如税务申报、客户尽调等场景——无需人工持续介入。这意味着，智能体 AI 正在从“演示阶段”走向“生产阶段”，而 Gemini 3.5 是目前门槛最低、最易上手的选择。
编程能力的跨越式飞跃是另一大核心亮点。
Gemini 3.5 Flash 在 GDPVal 评分中表现突出，具体能力涵盖从零构建全新应用、维护与迭代大型代码库、遗留代码迁移（如迁移至 Next.js 等现代框架），以及快速规划与迭代开发。
这里有一个值得对照的背景：2026 年以来，AI 编程助手的市场竞争已经进入白热化阶段。GitHub Copilot、Cursor、Windsurf 等工具背后，分别绑定了 OpenAI、Anthropic 和 Google 的模型能力。Gemini 3.5 Flash 如果真的如基准测试所示在编程任务上大幅领先，那么谷歌不仅在模型层面对竞争对手形成压力，在开发者工具生态层面也将获得更大的话语权。
多模态能力同样进一步升级。
基于 Gemini 3 的原生多模态基础构建，Gemini 3.5 能够生成更丰富、更具交互性的 Web UI 和图形界面（生成式 UI），对超过 100 页的复杂文件进行深度推理与信息检索。
它通过多模态 OCR 结合历史数据模式推理与复杂账单图像理解——这个能力听起来技术化，但实际场景非常具体：比如企业财务部门处理上千张供应商发票，过去需要人工逐一核对，现在可以由 AI 自主完成，且准确率在企业级场景中已经通过验证。
安全方面的升级，谷歌着墨不少，但外界的疑问也最多。
Gemini 3.5 基于 Google 前沿安全框架（Frontier Safety Framework） 开发，强化了网络安全与 CBRN（化学、生物、放射、核）防护措施，并引入可解释性工具——在 AI 给出最终回答前对其内部推理逻辑进行安全检查，在显著降低有害内容生成概率的同时，减少对合法查询的误拒率。
这里存在一个值得追问的矛盾：谷歌强调“可解释性”和“安全第一”，但与此同时，Gemini 3.5 正在大幅降低 AI 能力的获取门槛（速度更快、价格更低、全面开放 API）。门槛越低，被滥用的风险越高。谷歌的安全框架是否真能覆盖一个 Token 处理量达到 3.2 千万亿/月的开放生态？这个问题，皮查伊在台上没有回答。
皮查伊的全栈叙事：从模型到生态
皮查伊在 I/O 2026 主题演讲中的发言，是理解这次发布的关键。
他首先回顾了过去一年的进展：“自去年 I/O 以来，这是一段非凡的历程——持续的产品发布、技术突破和超高速进展。我们现在处于 AI 周期的一个阶段：人们希望在他们每天使用的产品中看到真正的价值。”
这句话的潜台词是：过去两年 AI 行业都在跑分、发论文、做演示，现在到了交成绩单的时候了。而谷歌的成绩单，就是搜索、Gemini App、Android 这几十亿用户产品的 AI 化改造。
关于搜索业务的演进，皮查伊说了一句分量很重的话：“如果我们从 27 年的搜索研发中学到了什么，那就是：延迟至关重要。”
这句话解释了为何 Gemini 3.5 在速度上的突破被谷歌置于如此核心的位置。在搜索这个亿级用户产品里，延迟直接决定用户体验与留存。这也是为什么“4 倍速度”不是一个技术指标，而是一个产品战略：只有足够快，AI 搜索才有可能替代传统搜索，成为用户的主流选择。
皮查伊透露，搭载 AI 功能的搜索功能正在改变用户行为——搜索已不再只是单次查询，而更像是一次持续的对话，而当人们在搜索中使用 AI 驱动的功能时，他们使用搜索的频率更高了。这对谷歌来说是一个极其重要的信号：AI 功能不是蚕食搜索的现有流量，而是在创造新的使用场景和更高的使用频次。
对于智能体时代的战略判断，皮查伊的表态更加明确：“我们正超级专注于将智能体的力量，安全、可靠地带给消费者，让它为每个人服务。”
这句话的野心比听起来大得多。
“为每个人服务”意味着谷歌不仅要占领企业市场，还要占领消费级市场。而要实现这一点，光有模型不够，必须有全栈能力：芯片（TPU 8）、模型（Gemini 3.5）、平台（Antigravity 2.0）、终端产品（Spark、搜索、Android）。皮查伊在演讲中勾勒的正是这条完整的技术栈路径。
这条全栈路径的核心逻辑是：以极致性价比与极速推理，驱动智能体在消费端和企业端的规模化落地。而这，恰恰是 OpenAI 没有芯片、Anthropic 没有终端产品、Meta 没有企业级全栈的竞争对手们短期内难以复制的壁垒。
基于上述战略框架，皮查伊公布了多项即将落地的关键产品。
Gemini Spark——基于 Gemini 3.5 Flash 与 Antigravity 平台驱动的个人 AI 智能体——将在下周向美国 Google AI Ultra 订阅用户开放 Beta。它能够 24/7 运行，处理长周期复杂任务，并通过 MCP 协议接入第三方工具。这意味着，Spark 不是一个封闭在谷歌生态里的助手，而是一个可以连接外部服务的开放智能体——这个设计选择，明显是在对标 OpenAI 的插件生态。
搜索信息智能体将于 2026 年夏季推出，在后台 24/7 运行，主动发现信息并代为执行操作。Daily Brief Agent 将整合用户的邮件、日历与任务，生成个性化晨间摘要。Android Halo 将于 2026 年晚些时候推出，为用户提供实时智能体任务追踪界面。搭载 AI 功能的音频眼镜硬件产品则定于 2026 年秋季发布。
而更强大的 Gemini 3.5 Pro，皮查伊透露“已在 Google 内部使用，展现出极大的性能提升”，预计下月正式推出。Pro 版的发布，将直接与 OpenAI 的 GPT 系列和 Anthropic 的 Claude Opus 系列展开正面竞争。
这些产品构想是否靠谱，一个重要的验证维度是：企业客户有没有真的在用、真的在付钱？
谷歌在发布会上列举了多家企业客户的使用案例。但需要指出的是，这些案例均为谷歌主动披露，第三方独立验证数据尚待观察。不过从已披露的信息来看，应用场景确实覆盖了企业 AI 化的核心痛点。
Shopify 利用并行多子智能体分析长周期复杂数据，体现多智能体协作能力；麦格理银行借助 Gemini 3.5 加速客户开户流程，能够对 100 页以上的复杂文件进行推理并给出合规建议——这个场景如果真的跑通，对金融行业的 AI 落地将是一个重要信号；Salesforce（Agentforce） 依托其跨步骤工具调用能力自动化企业任务；Ramp 应用其多模态 OCR 能力处理复杂账单；Xero 让其自主管理数周的 workflows（如 1099 税务表格处理）；Databricks 则利用其海量数据集推理能力进行实时监测。
把这些案例放在一起，一个共同的规律浮现出来：Gemini 3.5 的企业价值，不在于“更聪明”，而在于“更持久、更快速、更便宜地执行长周期任务”。这正是智能体 AI 从演示走向生产的关键门槛。
从生态集成的角度看，Gemini 3.5 Flash 即日起已在多个层面全面开放。
消费端作为 Gemini App 和 Google 搜索 AI 模式的全球默认模型；开发者端通过 Google AI Studio、Gemini API 和 Android Studio 提供服务；企业端则通过 Gemini Enterprise Agent Platform 支持部署。
这种全栈覆盖的开放策略，与皮查伊所强调的“让智能体的力量为每个人服务”形成了战略呼应。但与此同时，一个值得警惕的问题是：当谷歌同时控制了模型、平台、开发工具和终端产品时，开发者和其他企业是否正在被逐步锁定在谷歌的生态系统里？“开放 API”和“开放生态”之间，并不总是等号。
规模即壁垒：1800 亿美元背后的逻辑
支撑这一切的，是 Google AI 全栈持续释放的规模势能。
皮查伊在演讲中披露的最新数据显示：月度 Token 处理量已达到 3.2 千万亿（quadrillion），同比增长 7 倍。这个数字意味着，谷歌的 AI 基础设施正在以远超行业平均的速度扩张。
Gemini App 月活跃用户从 4 亿增长至 9 亿，一年内实现翻倍；搜索 AI 模式月活跃用户突破 10 亿；AI Overviews 月活跃用户达到 25 亿；基于 Google 模型进行开发的开发者达到 850 万/月。
而最震撼的数字或许是这一个：2026 年预计资本支出高达 1800 至 1900 亿美元，较 2022 年的约 310 亿美元大幅增长。
这 1800 多亿美元的资本支出，本质上是在做一件事：用基础设施的规模化优势，把竞争对手挤出市场。当你的 TPU 集群规模、Token 处理量和用户基数都达到竞争对手无法匹敌的量级时，“速度 4 倍、价格砍半”就不再是一个促销手段，而是一个结构性壁垒。
回到最根本的问题：Gemini 3.5 的发布，究竟是一次真正的技术飞跃，还是一次精心包装的战略营销？
答案可能是：两者都是。
从技术角度看，Gemini 3.5 Flash 在基准测试中的表现、推理速度的提升、以及多智能体并行架构的落地，都是真实的进步。但与此同时，这次发布真正值得关注的，不是模型本身，而是谷歌围绕模型构建的全栈壁垒：TPU 8 提供算力、Gemini 3.5 提供智能、Antigravity 2.0 提供平台、Spark 和搜索提供触达——这条链条上的每一个环节，谷歌都握有主动权。
对开发者和企业来说，这意味着选择 Gemini 3.5 不仅是选择一个模型，更是选择一个生态。而对 OpenAI、Anthropic 和 Meta 来说，Gemini 3.5 的发布传递的信息很明确：单靠模型能力已经不够了，谁能把模型、平台和产品连成一体，谁才能赢得智能体时代。
正如皮查伊在演讲结尾所言：“当我们放眼整个创新技术栈，可以清晰地看到——我们正坚定地步入智能体化的 Gemini 时代。”
这句话是宣言，也是向竞争对手发出的挑战。（本文首发钛媒体APP，作者 | 硅谷Tech_news，编辑 | 秦聪慧）

标签：智能谷歌模型任务能力 皮查伊 企业工具产品 竞争对手 基准全栈 开发者 生态编程场景用户客户速度战略功能平台数据步骤规模核心行业价格性能作者路径层面

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

iOS 27 第二个开发者测试版似乎暗示了一款新的苹果产品

工业互联网深度下沉，中小工厂全面数字化转型

腾讯阿里百度都来助力可灵，能和字节的seedance掰手腕吗？

浙大校友再战IPO！做半导体“保安”年入18亿，比亚迪、海康威视都下单

彭博：为什么全球机场无法关闭吸烟休息室

李飞飞、Jim Fan、徐丹飞联手，给具身智能指了一条新路

全站最新

iOS 27 第二个开发者测试版似乎暗示了一款新的苹果产品

工业互联网深度下沉，中小工厂全面数字化转型

腾讯阿里百度都来助力可灵，能和字节的seedance掰手腕吗？

浙大校友再战IPO！做半导体“保安”年入18亿，比亚迪、海康威视都下单

热门推荐

iOS 27 第二个开发者测试版似乎暗示了一款新的苹果产品

工业互联网深度下沉，中小工厂全面数字化转型

腾讯阿里百度都来助力可灵，能和字节的seedance掰手腕吗？

浙大校友再战IPO！做半导体“保安”年入18亿，比亚迪、海康威视都下单

彭博：为什么全球机场无法关闭吸烟休息室

李飞飞、Jim Fan、徐丹飞联手，给具身智能指了一条新路

别想用软色情做智能体的跳板

别争了！香农老婆，才是世界上第一个大语言模型

丰田将借助AI把各部门4.5万个专业术语精简至5000个

华为：截至目前，搭载乾崑智驾的车辆已超过190万辆

vivo X Fold6折叠屏手机首销情况曝光，同期约为上一代的90%

清华特奖获得者顾煜贤，加入DeepSeek

苹果采购国产内存不太容易向三星等施压谈判才是真

OpenAI塌房！Scaling law原作曝bug，万亿算力全白烧

全国百强汽车经销商内部通知曝光：亏损板块7月经理级以上全部0工资