埃隆·马斯克(Elon Musk)旗下的 AI 初创公司xAI近日被曝在过去数月内,直接利用 Anthropic 公司的旗舰模型 Claude 的输出数据来训练自身的 Grok 编码模型。
据《The Information》披露,尽管 Anthropic 已于2026年1月撤销了 xAI 的官方 API 访问权限,但 xAI 工程师随后转入“地下”,继续通过个人账户及第三方中间服务 Blackbox AI 进行数据提取。此前,马斯克曾在法庭上承认 xAI“部分”使用了 OpenAI 的模型进行训练,并称这种利用头部模型输出进行合成数据流转的做法已成为“行业标准”。
然而,外部依赖未能掩盖其内部研发的动荡,目前 xAI 的预训练团队已缩减至不足五人,包括四位 Grok 代码负责人在内的多位联合创始人已于近几个月内相继离职,近期更发生员工意外删除关键训练数据、导致两至三周工作成果付诸东流的重大失误,迫使其算力资源目前只能通过 SpaceX 临时转租给谷歌等企业。
这一事件不仅将 xAI 推至风口浪尖,也折射出当前生成式 AI 行业在高质量训练数据枯竭背景下的普遍焦虑。在合规开源数据触及天花板的当下,通过“知识蒸馏”和擦边球式的合成数据提取来提升模型性能,已成为后来者追赶第一梯队的灰色捷径。xAI 此次面临的技术路线依赖与核心团队流失,预示着单纯依赖算力堆叠和外部数据嫁接的模式正遭遇瓶颈,AI 独角兽企业亟需在底层自主创新与组织稳定性上寻找更稳固的支撑。





京公网安备 11011402013531号