新智元报道
马斯克深夜官宣:1.5万亿参数Grok V9训练完成,现役三倍!更狠的是,训练数据直接灌入大量Cursor编程交互记录。
马斯克的编程三板斧,一口气全亮了!
就在5月25日凌晨,马斯克在上亲自官宣:
1.5万亿参数的Grok基座模型V9-Medium训练完成,是现役模型的整整三倍,2到3周后面向公众发布。
几乎同一时间,更劲爆的细节浮出水面——
训练过程中,xAI往模型里灌入了大量Cursor编程数据。
对此,老马直接放话,Grok的编程能力将得到大幅提升。
再加上600亿锁定Cursor、Grok Build编程Agent上线,马斯克围绕编程赛道的布局,已经全面摊牌。
1.5万亿参数,Grok 5要来了
V9-Medium是xAI内部版本代号,对应的产品名几乎可以确定就是「Grok 5」。
参数规模1.5万亿,现役v8-small(5000亿参数)的整整三倍,并且针对英伟达Blackwell架构GPU进行了专项优化。
对于现在的Grok,就连马斯克本人都嫌弃得不行——「垃圾太多了」。
V9-Medium要还的,就是这笔债。
而还债的核心手段,就藏在帖子里那句「大量Cursor数据」。
偷师Cursor:拿着答案卷复习考试
Cursor的分量不用多说。
超过67%的财富500强企业在用,2026年底预计年化收入突破60亿美元。
老黄公开表示,Cursor是他最喜欢的企业级AI服务。
用Cursor数据训练Grok V9,就相当于拿着答案卷复习考试。
只不过这场考试考的是写代码,而答案卷就是工程师们实际写代码的方式。
某种意义上这既算作弊,又恰恰是正解。
这背后的原因在于,如今LLM的瓶颈不是写基本语法,而是理解复杂工程逻辑、多文件代码库和真实的调试工作流。
而Cursor有着大量来自真实开发者与AI协同编程的完整交互记录——prompt设计、代码修改、bug调试、多文件协作。
因此,恰好能补上这个缺口。
网友Peter Kuhar干脆直接问Grok本尊「Cursor数据到底包含什么」,Grok还真答了——
高质量的真实编程交互,包括开发者的prompt、代码上下文、编辑操作和任务完成记录。
值得一提的是,除了V9的发布外,此前的v8-small(0.5T)模型将在年底前开源。
编程全家桶,齐了
回看这段时间的操作不难发现,马斯克在编程赛道上的布局是一套三连击。
第一步,600亿美元锁定Cursor。
4月21日,SpaceX宣布与Cursor达成协议,拿到了以600亿美元收购Cursor的期权。如果年底前不行使,支付100亿美元合作费。
SpaceX在声明中表示:「SpaceXAI与Cursor正在紧密合作,打造全球最好的编程和知识工作AI。」
600亿锁定一家编程工具公司,马斯克对AI编程这条赛道有多看重,不用多说了。
第二步,Cursor数据直接灌进模型。
公开代码能训出基本功,但Cursor的私域编程交互数据,才是打造编程「尖子生」的核心燃料。
第三步,Grok Build编程Agent正式上线。
5月14日,xAI发布了Grok Build——
终端级AI编程Agent,命令行运行,支持代码生成、文件编辑、依赖管理、shell命令执行。
最大卖点是最多8个子Agent并行工作。
定价是SuperGrok Heavy订阅每月300美元,前六个月促销价99美元。
值得一提的是,Grok Build原生兼容Claude Code的CLAUDE.md配置文件。
没错,xAI做的工具,原生支持竞品Claude的配置格式。
Claude Code在开发者中的地位已经是事实标准,而xAI为了降低迁移成本,愿意主动兼容对手生态。
务实,但也多少有点心酸。
至此,三步棋全部落完——收购拿分发,数据拿能力,Agent拿入口。
全部指向同一个目标:AI编程。
Grok离编程王座还有多远?
把Grok放到编程赛道的坐标系里,差距一目了然。
SWE-bench Verified是目前开发者社区最关注的AI编程基准测试。
然而,与OpenAI和Anthropic相比,Grok差的是一整个身位——
GPT-5.5:88.7%。
Claude Opus 4.6:80.8%。
Grok 4系列:72%-75%。
更惨的是企业采用率。
Enterprise Technology Research的数据显示,截至2026年3月,企业用户中OpenAI占55%,Anthropic从一年前的20%飙升到47%,谷歌39%。而Grok只有区区的6%。
参数翻三倍加上Cursor数据,V9-Medium确实有可能带来质变。
但参数规模和能力从来不是线性关系,训练数据质量和RLHF精度往往更关键。
有分析推测,xAI可能在预训练后期就已经灌入了大量编程数据,类似Cursor Composer 2.5的heavy mid-training策略,这样post-training阶段确实可以压缩。
6月决战,四家硬碰硬
马斯克选择在这个时候亮牌,时间点很微妙。
SpaceX将于6月12日在纳斯达克上市,目标估值1.75万亿美元,若成功将是史上最大IPO。收购Cursor的600亿美元交易预计在IPO后30天内完成。
V9-Medium的公开发布,恰好卡在IPO之前。
更可怕的是,这不是马斯克一个人在加速。
OpenAI的GPT-5.6已经在Codex后台泄露,代号iris-alpha,150万Token上下文窗口实测跑通。Polymarket预测6月底前发布概率超过85%。
Anthropic的Claude Opus 4.8已在Google Vertex后台现身。Sonnet 4.8跳过4.7直奔4.8。曾被称为「太危险不公开」的Mythos 1,也在Claude界面短暂露脸。
谷歌的Gemini 3.5 Pro,同样定档6月。
四家前沿实验室,同一个月,硬碰硬。这个6月,注定是2026年AI领域最惨烈的一场混战。
前沿实验室之间的差距现在已经缩到以周为单位,单次发布不再重要,节奏才是关键。
马斯克赌的就是这个节奏。
V9-Medium不需要一炮封王,它需要的是证明xAI还在牌桌上,而且手里不止一张牌。
至于那台月租12.5亿美元租给Anthropic的Colossus 1——帮对手训模型的同时,也在帮自己续命。
这场AI军备竞赛里,活着比赢更重要。
而活着的前提,是有人愿意为你的算力买单。哪怕那个人,恰好是你的对手。
参考资料:
https://x.com/testingcatalog/status/2058800215960719861
https://x.com/elonmusk/status/2058787384364265734
编辑:摩西





京公网安备 11011402013531号