当前位置: 首页 » 资讯 » 科技头条 » 正文

谷歌Agent正在憋大招:AI科学家内测,锦标赛制“炼”想法,一次跑40分钟

IP属地 中国·北京 AI寒武纪 时间:2025-11-18 08:10:13


谷歌正秘密为其企业级产品Gemini Enterprise开发一项新功能:一个多智能体(multi-agent)系统,它能够扮演联席科学家或研究员的角色,帮助用户提炼想法,实现研究自动化

具体来说,该系统的工作流程是:接收一个主题和一套评估标准,生成大量想法,然后启动一个智能体团队,以锦标赛(tournament-style)的形式对这些想法进行评估

值得注意的是,该系统能够让Gemini就单个问题持续运行约40分钟,这对于一个面向用户的产品而言,是一次非常长的连续运行

在运行结束后,用户会收到一份根据所选标准从优到劣排序的想法列表,一次运行可产出约100个想法


对于每个想法,用户会得到概述、详细描述、评审摘要、完整评审报告以及专门的锦标赛表现报告。这份锦标赛表现报告会作为一项独立输出,可供单独浏览。所有生成的想法都是可选的,方便用户专注于特定选项并进行更深入的探索


两款核心智能体:“想法生成”与“联席科学家”

在目前的预览版中,谷歌准备了三款预置智能体,其中两款建立在这一多智能体锦标赛系统之上


一款名为“想法生成”(Idea Generation)。用户提供一个主题,该智能体便会启动多智能体工作流,通过锦标赛式评估来生成与该主题相关的想法并进行排序

另一款名为“联席科学家”(Co-scientist),更侧重于科学家和研究人员。它允许用户指定一个研究课题,提供额外数据,然后由一个智能体团队通过相同的锦标赛机制来生成和评估想法,但更聚焦于研究和科学用例

L3级AI的体现:强大的算力投入

这一设置最引人注目的方面之一,是其背后巨大的算力投入。

让智能体就单个任务工作约40分钟,与典型的智能体工具相比,算力消耗相当大。在整个运行期间,系统会持续对问题进行迭代


与现有的智能体实现相比,这似乎是一个重要的进步。即使是像ChatGPT中那些能够使用浏览器模式的高级智能体,通常也受到有限的上下文窗口和时间预算的限制。相比之下,谷歌的这种方法被设计成一个面向用户的产品,直接向企业客户开放了非常高的算力


这也与“L3级AI”的理念相符,即智能体能够持续较长时间处理一个问题。在这种背景下,单任务运行40分钟是一个有力的例证

目前,所有这些功能都出现在开发中的Gemini Enterprise内部,尚未对普通用户开放

不止于原始建议,输出结构化研究方向

在实践中,其主要输出是一套经过提炼的想法

但这些不仅仅是原始建议,而是结构化的研究方向。考虑到输入的数据和原始问题,这些方向可能带来极具价值的洞见。这体现了谷歌正致力于为组织、企业和研究团队提供极其强大的智能体


当该功能最终发布时,可能会是一次重大飞跃,特别是如果这些智能体最终由尚未发布的Gemini 3 Pro驱动。目前,Gemini 3 Pro尚未在Gemini Enterprise中可用,因此尚不清楚驱动这些实验性智能体的具体模型。

此外,该系统还有一个工作流程细节:当用户提交提示时,系统会首先展示一份计划中的评估和想法维度的摘要。用户在审查并批准该摘要后,才能启动实际任务,以确保在投入大量算力之前,初始提示被正确理解

另一项新功能:与文档对话

除了多智能体锦标赛流程外,还有另一款名为“与文档对话”的智能体,它拥有一个独立的UI

该智能体允许用户上传最大30MB的PDF文件,并与这些文档进行明确的对话。其目标是让模型能够分析和整合多达30MB的PDF内容到上下文,以便用户从现有文档中提取更有意义的信息。

该功能同样是Gemini Enterprise的一部分,尚未发布,且目前在生产环境中无法使用。

在Gemini Enterprise正在开发的多项功能中,多智能体锦标赛工作流和专注于文档的智能体最为突出。

特别是基于锦标赛的多智能体设置,看起来是一个突破性的产品方向,其他LLM提供商尚未真正提供达到这种水平的服务。多智能体锦标赛在面向用户的工具中仍然很少见

一旦这些智能体更加成熟,看到它们正式的评估和基准测试将非常有价值。仅从描述来看,“联席科学家”智能体对于那些积极探索新科学方向的大型组织和研究团队来说,已经像一个非常有吸引力的工具。

目前尚不清楚这些智能体将于何时发布,也不确定是否会向企业客户之外的用户提供,但这绝对是值得关注的动向

参考:

https://www.testingcatalog.com/google-to-enable-research-automation-on-gemini-enterprise/

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。