当前位置: 首页 » 资讯 » 科技头条 » 正文

Gemini 3登顶,一文快速看懂谷歌AI如何逆风翻盘 | 巴伦精选

IP属地 中国·北京 钛媒体APP 时间:2025-11-19 22:13:36


图片来自:网络

过去三年,谷歌的AI故事堪称一部跌宕起伏的“逆袭”故事。

从2022年底ChatGPT掀起的行业地震,到2023年Bard的“翻车”危机,再到今天Gemini 3的绝地反击。人们不禁好奇,这家科技巨头在AI浪潮中经历了怎样的卧薪藏胆,才成就了今天的蝶变?

在Gemini 3发布震动行业的日子,我们一起来回顾谷歌的逆袭之路。

谷歌AI大事记2023年:危机与觉醒

2022年11月30日,OpenAI发布ChatGPT的那一刻,谷歌总部陷入罕见的集体焦虑。这款基于Transformer架构的聊天机器人,以近乎“人类化”的对话能力迅速引爆全球,而谷歌引以为傲的LaMDA模型却因“幻觉问题”和商业化迟缓陷入被动。

12月,谷歌启动代号“代码红”的紧急计划,抽调100名工程师组成“Bard突击队”,目标是在100天内推出对标产品。时任搜索业务副总裁的Sissie Hsiao带领团队打破部门壁垒,整合搜索、Assistant和DeepMind资源,甚至临时调用数据中心极限算力。

次年2月,谷歌仓促推出基于LaMDA的聊天机器人Bard,在演示中误称“詹姆斯·韦伯望远镜拍摄首张系外行星照片”,导致Alphabet股价单日暴跌8%,市值蒸发超1000亿美元,这一事件成为谷歌AI战略滞后的公开警示,暴露了其在产品化与危机公关上的双重短板。

4月,DeepMind与Google Brain合并面对OpenAI的强势冲击,谷歌将两大核心AI团队DeepMind(强化学习与多模态研究)与Google Brain(Transformer架构与基础设施)合并为Google DeepMind(GDM),由戴密斯·哈萨比斯(Demis Hassabis)担任CEO,杰夫·迪恩(Jeff Dean)转任首席科学家,此次整合终结了内部资源分散与技术路线竞争,为Gemini模型的集中研发铺平道路。

8个月后,Gemini 1.0发布首个原生多模态模型,在57项MMLU测试中90%超越人类专家,支持文本、图像、音频、视频交互,但其初期因“过度多样化”策略引发市场疑虑,股价波动幅度达12%,被质疑技术路线过于激进。

2024年:迎头赶上

2月,Bard正式更名Gemini,原Bard团队并入GDM,标志着其AI品牌向Gemini系列集中。同步推出的Gemini Advanced(19.99美元/月),支持代码编写、数据分析等复杂任务,首月付费用户突破500万,其API调用量在OpenRouter平台占比达35%,超越Claude 3和GPT-4。

5月,Veo 3视频模型发布,对标Sora,支持1080p分辨率、60秒动态生成,画面细节与物理模拟能力接近OpenAI Sora,其音画同步技术被《好莱坞报道》评价为“突破影视制作传统流程”。

12月,Gemini 2.0发布。轻量级模型Gemini 2.0 Flash免费开放,API调用量反超Claude 3和GPT-4,集成“深度研究”功能,支持长文本解析与多步骤推理,在LeetCode编程测试中准确率较GPT-4提升18%,开发者生态初具规模。

2025年:全面反扑

3月,Gemini 2.5 Pro登顶LMSYS Chatbot Arena榜单,评分超越GPT-4o和Claude 3 Opus,同时制霸文本、视觉、Web开发三大榜单,被称“三连冠”,其数学推理能力在国际数学奥林匹克竞赛(IMO)中以35分(满分42分)超越GroK 4和OpenAI o3。

5月,I/O大会上发布Gemini 2.5 Pro,集成“深度研究”功能,上线249.99美元/月的“Google AI Ultra”订阅,含高级工具调用权限,同时推出AI眼镜原型Project Aura,其端侧计算能力支持实时AR导航与多语言翻译,被视为消费级AI硬件的里程碑。

9月,搜索上线“AI模式”支持多模态查询(文字+拍照+语音),直接生成包含行程、费用、用户评价的“一站式答案”,搜索广告收入同比增长10.4%,用户平均查询时长从15秒延长至42秒,证明AI对核心业务的重塑能力。

11月,谷歌再次抛出重磅炸弹。Gemini 3 pro在数学、推理、多模态与Agent工具指标等多纬度关键指标上全面超越同级别竞品,引发了行业巨震。OpenAI CEO奥特曼罕见发推表示祝贺。

至此,谷歌完成了从追赶者到领跑者的逆袭之路。

谷歌AI的组织、人才与投入

谷歌在模型上的戏剧性逆袭的背后,是其重大组织架构调整、激进人才策略与巨额研发投入的胜利。

首先,从2023年至今,谷歌AI板块架构经历了从分散到集权的巨大变化。

2023年4月之前,谷歌的AI板块还是DeepMind与Google Brain两个独立团队的双轨制架构,人才与算力都分散在两支团队,因此形成的开发重叠与算力浪费引发了巨大争议。4月,两支团队正式合并,成立GDM,哈萨比斯任CEO,迪恩升任首席科学家,专注基础研究,原Brain团队负责工程落地,DeepMind团队主攻算法创新,形成“基础研究-产品开发”双螺旋结构。

2024年2月,brad团队正式并入GDM,同时更名Gemini,形成GDM的第三极力量。搜索与广告业务高管Raghavan升任CTO,强化技术-产品协同,设立“AI作战室”实时同步模型性能数据,高管每日晨会汇报进度,决策链条缩短至48小时。

“三国归晋”的局面,不但集中了谷歌的所有研发力量和资源,同时形成了算力—算法—应用的生态闭环,也在品牌上将所有谷歌AI的产品线统一到了Gemini,这也极大程度地提升了市场对于谷歌AI生态的认同。后期全球多家科技巨头都效仿其品牌统一与生态协同的AI生态策略。

另一方面,谷歌的AI生态的逆袭也离不开三位关键人。

首先是DeepMind创始人哈萨比斯,他主导了Gemini战略,并用“科学发现驱动产品”的理念重塑谷歌AI文化;第二位当属谷歌的首席科学家迪恩,他推动Transformer架构优化,并主导制定《AI负责任开发白皮书》;另一位则是2025年空降的首席AI架构师。

还有就是科雷·卡武克乔格鲁(Koray Kavukcuoglu),曾主导Meta MLC研究,推动Gemini与TPU深度绑定,其“硬件—模型协同设计”方法论降低训练能耗25%。

以三位核心关键人为核心,谷歌在挖人和薪酬设计的动作上也非常激进。2024年,以200万美元的签字费和0.8%的公司期权,从Open AI挖角洛根·基尔帕特里克(Logan Kilpatrick,Gemini开发者生态负责人)和诺姆·沙齐尔(Noam Shazeer,Gemini技术联合负责人),一度成为当时最大手笔的挖角动作。

另外,据公开信息显示,谷歌给团队内的顶尖科学家们开出的平均薪资高达200-300万美元(含股票),高于微软、Meta的平均薪资水平约20%-30%,核心团队还可获0.5%-2%公司期权。大手笔的薪酬体系无疑为谷歌AI的快速崛起打下了坚实的人才基础。

而高薪的另一面,也是谷歌抛弃了一贯的轻松工作文化,转而加入了“内卷”文化的极大牺牲。有媒体报道称,Bard团队每周工作90小时,推行“996敏捷开发”机制,而且还有30%的淘汰率考核。2024年,谷歌甚至因为高压的工作环境引发员工抗议“过度加班”,硅谷工会发起“AI劳工权益运动”。谷歌被迫调整弹性工作制,增设“心理健康日”。

除了大刀阔斧的架构调整和激进的人才策略,谷歌在研发费用上的不计成本也成为行业难以复制的壁垒。

2023年谷歌财报数据显示全年支出315亿美元,三方机构Counterpoint报告显示其中AI相关占比6.8%,仅21.4亿美元;2024年财报数据显示支出525亿美元,三方机构LESG(路浮特)报告显示AI相关占比55%,约290亿美元;2025年,根据第二季度财报电话会议记录预测,全年支出预期900亿美元,AI相关占比约65%,预计约585亿美元。

以2024年的数据横向比较,据The information报道数据,Open AI全年支出约75亿美元;而eMarket数据显示,Meta的支出约为100亿美元。相比之下,谷歌遥遥领先的投入也注定了在AI生态上的一骑绝尘的发展速度。

结语

从Bard的惨败到Gemini的登顶,谷歌证明了自己AI策略的有效性,极大地激励了科技大厂在AI上继续坚定地投入。但面对OpenAI的激进创新、Meta的开源围剿,谷歌能否守住王座,仍取决于其后持续投入的能力与“生态开放性”的建设。正如《麻省理工科技评论》所言:“谷歌从未真正失去AI领导权,它只是需要一场漂亮的翻身仗来证明自己。”而Gemini 3的横空出世,或许只是这场战役的一个节点而已。(作者|陶天宇,编辑|李程程)

更多对全球市场、跨国公司和中国经济的深度分析与独家洞察,欢迎访问 Barron's巴伦中文网官方网站

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。