Anthropic指控DeepSeek、月之暗面、MiniMax三家公司通过约2.4万个虚假账号违规蒸馏Claude模型,生成超过1600万次对话用于训练自家模型,引发行业热议。RLHF领域专家Nathan Lambert对此指出,中国AI公司的成功并非靠走捷径,而是依赖扎实的基础设施建设和持续的技术创新。
Lambert将三家公司的情况分别分析,认为DeepSeek涉及的15万次交互量级极小,更像是内部实验而非系统性行为。月之暗面涉及340万次交互,集中在智能体推理、工具调用等Claude核心能力方向。MiniMax规模最大,约1300万次,目标为代理编码和复杂任务编排。月暗与MiniMax合计约1650万次,估算token成本达数百万美元。
Lambert强调蒸馏存在明显天花板,真正顶级的模型能力依赖强化学习而非简单模仿。他指出,模型需要通过自主探索、试错迭代来获得解题路径,这是蒸馏无法提供的。不同模型间的数据分布差异也让蒸馏效果大打折扣,需要大量工程优化才能发挥作用。
值得注意的是,Anthropic自身深陷版权争议。该公司曾被曝以破坏性方式扫描全球书籍,从盗版网站下载大量侵权内容,最终支付15亿美元和解金。马斯克公开批评Anthropic大规模窃取训练数据却指控他人。这种双重标准让Anthropic的指控显得缺乏说服力。
Lambert认为,Anthropic此时公开点名中国公司,技术防御并非首要动机,更像是向美国国防部递交的投名状。此前美国防部刚威胁Anthropic配合提供不受限制的使用权限,否则将其标记为供应链危险。这种选择性执法暴露了其地缘政治考量。
业内普遍认为,蒸馏能帮助模型快速入场,但要达到顶级水平必须依靠自主的强化学习训练。DeepSeek、月之暗面、MiniMax均具备完善的基础设施和优秀人才,绝非仅靠小聪明企图弯道超车的小作坊。Anthropic提出的蒸馏争议,折射出AI行业在规则模糊地带快速行动后,面临规则收紧时的复杂博弈。(爱范儿)





京公网安备 11011402013531号