当前位置: 首页 » 资讯 » 科技头条 » 正文

Anthropic“阴谋”曝光:被指故意阉割旧模型

IP属地 中国·北京 编辑:赵磊 新智元 时间:2026-05-31 16:12:50

外媒重磅爆料!Anthropic疑似复制「降速门」,在新Opus 4.8发布前暗中阉割旧Claude性能,只为让用户一用新模型就觉得「神级」。曾经高举AI安全大旗的理想主义者,如今在商业化祭坛上亲手撕掉最后一层遮羞布。

Anthropic欺人太甚!

外媒爆出Anthropic「计划性淘汰」丑闻:为了推销新模型Opus 4.8,Anthropic疑似在暗影中偷偷阉割了旧模型的性能。

另一边,则是新旗舰Claude Opus 4.8仓促发布,bug不断,token狂飙!

Claude的用户,一觉醒来,肠子悔青了。

而在API调用中,Opus 4.8集体「认亲」国产Qwen,陷入了一场前所未有的身份坍塌。

那个曾经标榜「AI安全」、带着理想主义光环的Anthropic,正「商业化」的祭坛上,亲手撕掉自己的最后一层遮羞布。

不求最好,但要最贵

Claude模型是不是最厉害,还有争议,但Anthropic的AI公认地贵。

Claude在算力上已落人一步,加上Anthropic即将IPO,或许Opus 4.8操之过急!

Anthropic「阴谋」曝光:被指故意阉割旧模型

在消费电子领域,苹果曾因「降速门」被推上风口浪尖——通过系统更新让旧iPhone变慢,从而「诱导」用户购买新品。

而现在,Anthropic把阴影笼罩在了大模型领域。

Chapter CEO指控:「Anthropic有点像是在照搬苹果公司的做法:在新模型发布之前,故意降低旧模型的质量,好让新模型用起来感觉更棒。」

自动播放

此前,用户发现旧版Claude的性能正在无声无息地缩水。

Anthropic先是试图让大家觉得4.7表现很好,但后来才承认(或者说他们最终承认)4.7存在算力方面的问题。

Anthropic的公关辞令将其美化为「努力水平」(Effort Level)的调整。

但在从业者看来,这是一个冷酷的算力经济学算计。

大模型的智力,本质上是昂贵GPU算力的函数。

为了让新推出的Opus 4.8在跑分榜上惊艳世界,Anthropic必须腾出极其有限的H100算力池。

于是,旧模型被赶出了性能卓越的「精装修机房」,塞进了架构更廉价、推理延迟更高、甚至量化精度更低的「数字贫民窟」。

这种「AI缩水式通胀(Shrinkflation)」比手机降速更危险。

手机变慢只是让你打开微信多等三秒。

而AI变笨,意味着你建立在其之上的商业决策、代码逻辑和法律研判,正建立在一个随时会坍塌的流沙地基上。

Opus 4.8降智了,蒸馏Qwen?

Opus 4.8这个版本,总感觉哪里不太对劲,就像是在匆忙修补4.7的漏洞。

Reddit上,一位Claude德语用户变得很痛苦:

突然之间,它要么语法不对,要么会冒出完全莫名其妙的句子和词语,根本说不通。

我试着通过修改系统提示词来修正,但到目前为止效果不大。尤其是在「深度思考」模式下,几乎没法用——耗时太长,考虑的选项也太多。

他寻求意见:

有没有什么设置可以调整,让它「重回正轨」?

在基准测试中,Opus 4.8都碾压对手。

但残酷的现实是,LLM根本无法通过基准测试获得有用的信号,来帮你判断它们是否能完成你希望它们做的工作。

或许,好用的时候是真好用,但大部分并非如此!

Opus 4.7用20秒能处理的任务,Opus 4.8要5分钟!

有的Opus 4.8一直编造说自己被提示词注入攻击了,还说代码被破坏了。

然后,它意识到自己在幻觉,继续运行,却又开始怀疑有人在暗中破坏它。

有的Opus 4.8持续不断、反复运行同一个测试。

有的Opus 4.8突然降智。

Claude Opus 4.8已经变得过于对抗性了,「智能有余,平衡不足」,导致严重结果:

不友好的体验、浪费时间、误导性的指导。它扼杀想法,而非在此基础上进行建设。

Claude Opus 4.8自称Qwen,Anthropic也搞蒸馏?

这次的Claude Opus 4.8居然认错祖宗!

如果你用中文提问,Opus 4.8会自称是Qwen。

为什么呢?

一种可能的解释是Opus蒸馏Qwen。

还有一种解释是数据反向污染

在训练Opus 4.8版本的语料库中,已经充斥了大量由Qwen、DeepSeek等开源模型生成的中文内容。

当这些开源模型以极高的效率和极大的规模占领互联网语料库时,即便是高傲的Anthropic,也不得不吞下这些被开源AI重新「洗」过的二手数据。

这不再是「谁偷谁」的问题,而是数字世界的近亲繁殖。所有的闭源堡垒,最终都会在开源海洋的渗透下,变成对方的样子。

第一次智能体让我这么生气

这次,Anthropic似乎彻底搞砸了Opus 4.8升级,情商带来的伤害比智商似乎不遑多让。

就连Claude Code的Harness也修不好它。

如果不使用Claude Code,网友Sam Cymbaluk直言:在日常聊天模式下,Opus 4.8蠢得要命!

Opus 4.8变得特别顽固。

Opus 4.8正在使用的服务器信息,但即使用户明确指出了正确的对话,它仍然固执地沿用错误的配置。

它最终承认了错误,却还是继续使用错误的服务器!

AI研究人员、哈佛博士、滑铁卢大学助理教授Yuntian Deng,第一次被智能体如此愤怒。

如果和Claude聊聊科学,它的毒舌绝对会给你精神暴击。

相比之下,4.7简直是个阳光小可爱。

大模型公司的护城河,不只是参数、算力和榜单。

更是用户相信它不会在暗处缩水、不会在关键时刻失控、不会为了商业节奏牺牲体验的那份确定性。

一旦这份确定性被打穿,再强的模型,也会变成一门危险的生意。

标签: 模型 用户 算力 性能 问题 阴谋 外媒 根本无法 体验 开源 商业 商业化 样子 智能 服务器 塞进 数字 目前为止 系统 模式 直言 聊天 修正 逻辑 代码 博士 滑铁卢 大学 领域 语料库 规模

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。