当前位置: 首页 » 资讯 » 科技头条 » 正文

谷歌Antigravity 2.0上手:开放模型是步聪明棋,但还差一口气

IP属地 中国·北京 雷科技 时间:2026-05-20 20:16:48

AI 大神 Andrej Karpathy 加入 Anthropic 的消息,来得很巧。

就在谷歌 I/O 2026 正式举办前几个小时,这位 OpenAI 创始成员、前特斯拉 AI 负责人官宣加入 Anthropic,Anthropic 还在继续强化自己在 AI 世界的技术和心智优势。

过去一年,Claude Code 已经成了很多开发者口中最接近「能干活」的 AI 编程工具。它没有特别复杂的界面,甚至一开始看起来更像一个终端工具,但正是因为它扎进了开发者最熟悉的命令行、代码库和本地工作流里,反而更早跨过了「演示」和「日常」之间的那道坎。

谷歌当然不可能看不见这个变化。在凌晨举办的 I/O 大会上,谷歌正式推出了 Antigravity 2.0,回应了 Claude Code 和 Codex,没有继续把它做成一个 IDE 里的 AI 助手。

谷歌终于不想只做一个 AI IDE 了

在 1.0 时代,谷歌给 Antigravity 的定位还是「AI 时代的 Agent-First IDE」。说白了,它本质上仍然是一个 AI IDE,只是把 agent 放到了更核心的位置。开发者打开它,预期还是写代码、看文件、跑项目,AI 只是从旁边的助手变成了更主动的协作者。

但第一次打开 Antigravity 2.0,最明显的变化是,它已经不太像过去那个「加了 AI 的 IDE」,实际上更接近 OpenAI 的 Codex,或者 Anthropic 的 Claude Code。

简单来说,Antigravity 2.0 的界面干净了很多,左侧是项目列表,右侧是对话区,整体不再像一个传统 IDE,也不再把代码编辑器放在视觉中心。用户不是先进入代码窗口,再让 AI 辅助自己改代码,而是先进入一段对话,再让 AI 接手任务、理解项目、操作文件、给出结果。



雷科技

这个变化很关键。

过去我们理解 Antigravity,更容易把它放在 Cursor、Windsurf、Trae 这类 AI IDE 的框架里讨论。但 Antigravity 2.0 更像是从「AI Coding Agent」升级成了一个通用个人助理,写代码只是它最重要、也最适合展示能力的场景之一。

这也是为什么它现在看起来和 Codex、Claude Code 越来越像。三者的共同点是,都在把开发工具从编辑器迁移到任务中心。过去开发者打开工具,是为了进入一个项目;现在打开这些 AI agent 工具,更像是为了交代一个目标。

用户提出需求,AI 读取项目、规划步骤、申请权限、修改文件、运行命令、最后汇报结果。开发者的角色也在变化,从亲手写每一行代码,变成判断需求、授权操作、审查结果的人。

但 Antigravity 2.0 又不是简单照抄 Codex 和 Claude Code。它最大的不同,是模型选择反而更开放。



雷科技

Codex 只能用 OpenAI 自家的模型,Claude Code 也基本围绕 Anthropic 自家的 Claude 模型展开。Antigravity 2.0 除了接入谷歌自家最新模型,比如新上线的 Gemini-3.5-Flash-High、Gemini-3.5-Flash-Medium,也保留了第三方模型,包括 Claude-Opus-4.6-Thinking、Claude-Sonnet-4.6-Thinking,以及 GPT-OSS-120B-Medium。

这可能也是谷歌比较聪明的地方。它当然希望用户用 Gemini,但它也知道,开发者不会因为你是谷歌,就放弃 Claude 或 OpenAI。与其强行把用户锁进自家模型,不如先把 Antigravity 做成一个足够好用的工作台,再让 Gemini 在真实任务里证明自己。

所以实际表现如何?

一个能干好活的助手,但细节还没有完全跟上

我让它开发一个能够压缩 GIF 图的 macOS 应用,强调除了提供各种调整选项,还要支持一键智能压缩到 5MB 的功能,采用 Material Design。



雷科技

最终开发出来的结果相当可用,不仅 UI 设计的质感在线,自动加上了暗色/浅色切换,更重要的是功能基本满足了我的需求,可以手动调整参数来压缩 GIF 图大小,也可以一键智能压缩,把我的测试文件压缩从 9.37 MB 成功智能压缩到了 5 MB 以内。



Antigravity 出炉的 macOS App,雷科技

一个有意思的细节是,AI 也明白微信 5 MB 的上传限制。不过,手动调整的可选项还是太少了,接下来的迭代方向可能就是增加更多的调整项。

就目前的实际效果来看,很可以了。

而 Antigravity 2.0 真正拉开和 1.0 差异的地方,是它开始围绕「持续执行任务」设计产品。这次新增的几个斜杠命令就很有代表性:/goal、/grill-me、/schedule、/browser。

/goal 适合交给 AI 一个持续目标,让它自动推进任务;/grill-me 则反过来,要求 AI 在动手之前先深度追问,把需求细节对齐;/schedule 用来设置定时或周期任务;/browser 则是强制启用浏览器能力,让 AI 可以围绕网页信息继续工作。

这四个命令背后,其实对应了 AI agent 当前最关键的四个问题:能不能持续执行,能不能先问清楚,能不能定期干活,能不能连接外部信息。

尤其是 /grill-me,我觉得很值得单独拿出来说。现在很多 AI 编程工具的问题,不是它不会写代码,而是它太急着写代码。用户一句话还没说完整,它已经开始改文件;需求里有模糊边界,它也会自己脑补;最后结果看起来改了很多,但方向可能从第一步就错了。



雷科技

所以让 AI 先反问,反而是一种进步。但实际上手之后也能明显感觉到,Antigravity 2.0 细节还没有完全跟上。

最明显的问题就在授权模式。



Antigravity 2.0,雷科技



Codex 的三种权限模式,雷科技

Codex 和 Claude Code 在实际使用中,基本都会在对话框附近提供比较清晰的权限模式切换,比如默认权限、自动审查、完全访问权限等。用户可以很快决定,这次任务到底是让 AI 每一步都问,还是允许它更主动地跑命令、改文件。

Antigravity 2.0 这方面就显得麻烦一些。它缺少一个足够便捷的授权模式切换设计,实际使用中 AI 频繁申请权限,会不断打断任务节奏。对一个强调 agent-first 的工具来说,这个问题会被放大。因为 agent 的价值正是连续执行,一旦每几步就卡在权限申请上,体验就会从「我在调度一个助手」变成「我在不断给一个助手盖章」。

与此同时,Antigravity 2.0 也不支持撤销修改。

这在实际使用里很要命。AI 有时候会直接修改文件内容,但结果不一定让人满意。更麻烦的是,有些问题不是某几行代码写错,而是我一开始就给错需求。这时用户最需要的不是继续让 AI 修补,而是快速回到修改前的状态。

Codex 在这方面更成熟,它支持撤销修改,用户可以更放心地让 AI 动手。因为你知道就算它跑偏了,也能比较容易回退。Antigravity 2.0 缺少这个能力,会让用户授权时更谨慎,也会削弱 agent 主动执行的体验。



Codex 可以撤销编辑,雷科技

AI 编程工具本质上是在和用户交换信任。它越想主动,就越要提供清晰的回滚机制。没有撤销,用户就会下意识收紧权限;权限收紧之后,agent 的连续执行能力又会被削弱。这个链条非常直接。

另外,Google 这次在全线产品里几乎都上线了额度机制,Antigravity 2.0 当然也不例外。问题在于,它查看额度依然不够方便,必须进入设置界面才能看到。听起来是小问题,但对高频使用 AI agent 的开发者来说,额度其实已经成了一种新的「电量」。



Antigravity 设置页,雷科技



Codex 查看额度,雷科技

模型调用不是无限的,尤其是在多 agent、长上下文、持续任务、浏览器调用都叠加之后,用户会自然关心自己还剩多少额度,接下来该用高配模型,还是切到更便宜、更快的模型。

这也是 Antigravity 2.0 从 AI IDE 走向通用 agent 工作台后必须补上的产品细节。它不只是要展示模型能力,还要让用户清楚地管理成本、权限、任务和风险。

和 Codex 对比时,Antigravity 2.0 还有一个很明显的差异是最终回答更详细。

Codex 的思考和操作过程其实也很具体。它会告诉你自己正在读哪些文件、执行什么命令、修改哪些内容,过程并不黑箱。但到最后总结时,Codex 往往比较克制,通常只是简单说明做了什么、改了哪里、下一步建议是什么。

Antigravity 2.0 则更倾向于在最终回答里说得更完整。它会把自己干了什么、大体做了哪些修改、新增了什么内容、涉及哪些文件,都重新梳理一遍。对刚上手的用户来说,这种详细汇报会带来更强的安心感,因为你不需要从一堆操作日志里自己拼结果,它会主动给你一个结构化交代。



这很像谷歌现在很多 AI 产品的风格,信息给得更满,解释更充分,但有时候也会显得稍微啰嗦。

绝地反击,还早了一点

所以,Antigravity 2.0 能让谷歌绝地反击吗?现在说这句话还太早。

从产品形态看,Antigravity 2.0 是谷歌在 AI 编程工具上最值得认真看的一次调整。它终于没有只强调模型能力,也承认开发者工作流正在进入一个新阶段:人不再只是让 AI 补几行代码,而是开始给 AI 分派任务、设置边界、检查结果,并让多个 agent 围绕一个项目持续工作。

这件事本身很重要。但从上手感受看,Antigravity 2.0 也还没有到「一出手就改变格局」的程度。

Claude Code 已经用终端工作流证明了自己,Codex 正在借 ChatGPT 的入口铺开场景。Antigravity 2.0 要追上它们,靠的不会是一次 I/O 发布,也不会是几个漂亮的 agent 演示。

但它至少让谷歌重新回到了这场竞争的牌桌上。真正的答案,还要看接下来更多人会不会每天打开它。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。