当前位置: 首页 » 资讯 » 科技头条 » 正文

xAI解散,但Grok还在上新,马斯克官宣新模型

IP属地 中国·北京 编辑:李娜 机器之心 时间:2026-05-26 14:08:34

自从xAI解散、大批创始成员离职之后,大家都在关心一个问题:Grok是不是要凉了?

事实证明,并没有。就在昨天,马斯克对外透露了Grok最新模型的进展。据他介绍,参数量达1.5T的Grok基础模型V9-Medium已经完成训练,评估结果不错。

目前,模型正在进行微调,几天后将启动强化学习阶段。按照计划,Grok V9-Medium预计会在两到三周内公开发布。

马斯克表示,这将是一次重大升级。他此前承认,现在承载所有Grok生产流量的、参数量仅0.5T的v8-small(外部测试版本Grok 4.2)在训练数据的质量、全面性和比例上存在严重缺陷。新的Grok V9-Medium不仅将参数规模扩大到前代的3倍,还针对Blackwell架构GPU进行了专门优化。在各项能力上,新模型都会有显著提升,尤其是在处理复杂编程任务方面。

他还表示,现有的0.5T模型计划在本年底前开源,适合开发者本地运行、微调或构建应用。

值得一提的是,在后续的补充训练中,团队加入了大量来自Cursor的数据,并且这一数据源还会继续扩充。

这得益于马斯克豪掷千金的一场收购。今年4月份,SpaceX官方宣布,已获得在今年晚些时候以600亿美元收购Cursor的权利。当时,这一举动还让外界有点困惑,质疑Cursor是否真的值那么多钱。

但是,也有人认为,Cursor是开发者实际使用的AI代码编辑器,数据包含真实的工作流(写代码、调试、迭代、修复bug等),是「人类开发者如何思考」的映射,其价值非常独特。如果Grok新模型能够有效利用这些数据,那么它将更懂真实开发者的工作方式,而非只是GitHub上的公开代码。

除了新模型,马斯克近期推出的首款编码智能体Grok Build也是备受关注。你可以把它理解成马斯克版「Claude Code」——一个直接跑在你命令行里的AI程序员,能读代码、做计划、改文件、跑测试。

它比较明显的差异化设计是Plan Mode(计划模式)。你描述需求后,它不会直接乱改你的代码,而是先输出一份结构化的执行计划,列明每一步要做什么。你可以审阅、修改甚至重写整个计划,批准之后它才开始动手,所有改动以diff形式呈现。

其他关键功能还包括:并行子智能体(最多支持8个子智能体同时工作)、Arena Mode(让多个候选方案内部「打擂台」)、原生支持MCP和ACP、支持无界面运行等。

目前,Grok Build在开发者群体中已经收获了一些好评。

在Grok Build之前,终端原生编程智能体这个赛道已经有三个主要玩家:Anthropic的Claude Code、OpenAI的Codex CLI、Google的Gemini-powered Antigravity。Grok Build的加入,把这场竞赛从三强变成了四强。

有意思的是,马斯克此前公开承认过xAI在编程能力上落后,所以Grok Build的发布更像是一次「补课式入场」——功能架构上快速追平对手,再用Arena Mode这种差异化机制试图弯道超车。

不过目前的Grok Build,底层跑的还是grok-code-fast-1,具有256K-token的上下文窗口,在竞争对手面前显然不够看的。对于大型单一代码库和长时间运行的Agent会话,这样的上下文长度显然会成为瓶颈。

Grok V9-Medium的1.5T参数和Cursor真实工作流数据的注入,有望让整个工具拥有更强大的底层模型。

在未来的Agent战局中,马斯克的团队能否占据一席之地?我们拭目以待。

标签: 模型 马斯克 计划 开发者 智能 编程 代码 数据 功能 官宣新 大家 关心 架构 关键 质量 流量 规模 月份 有点 长度 全面性 数量 参数 官方 外界 瓶颈 终端 首款 原生 程序员 实际 微调

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。