Anthropic「阴谋」曝光：被指故意阉割旧模型

新智元报道

【新智元导读】外媒重磅爆料！Anthropic疑似复制「降速门」，在新Opus 4.8发布前暗中阉割旧Claude性能，只为让用户一用新模型就觉得「神级」。曾经高举AI安全大旗的理想主义者，如今在商业化祭坛上亲手撕掉最后一层遮羞布。

Anthropic欺人太甚！

外媒爆出Anthropic「计划性淘汰」丑闻：为了推销新模型Opus 4.8，Anthropic疑似在暗影中偷偷阉割了旧模型的性能。

另一边，则是新旗舰Claude Opus 4.8仓促发布，bug不断，token狂飙！

Claude的用户，一觉醒来，肠子悔青了。

而在API调用中，Opus 4.8集体「认亲」国产Qwen，陷入了一场前所未有的身份坍塌。

那个曾经标榜「AI安全」、带着理想主义光环的Anthropic，正「商业化」的祭坛上，亲手撕掉自己的最后一层遮羞布。

不求最好，但要最贵

Claude模型是不是最厉害，还有争议，但Anthropic的AI公认地贵。

Claude在算力上已落人一步，加上Anthropic即将IPO，或许Opus 4.8操之过急！

Anthropic「阴谋」曝光：被指故意阉割旧模型

在消费电子领域，苹果曾因「降速门」被推上风口浪尖——通过系统更新让旧iPhone变慢，从而「诱导」用户购买新品。

而现在，Anthropic把阴影笼罩在了大模型领域。

Chapter CEO指控：「Anthropic有点像是在照搬苹果公司的做法：在新模型发布之前，故意降低旧模型的质量，好让新模型用起来感觉更棒。」

此前，用户发现旧版Claude的性能正在无声无息地缩水。

Anthropic先是试图让大家觉得4.7表现很好，但后来才承认（或者说他们最终承认）4.7存在算力方面的问题。

Anthropic的公关辞令将其美化为「努力水平」（Effort Level）的调整。

但在从业者看来，这是一个冷酷的算力经济学算计。

大模型的智力，本质上是昂贵GPU算力的函数。

为了让新推出的Opus 4.8在跑分榜上惊艳世界，Anthropic必须腾出极其有限的H100算力池。

于是，旧模型被赶出了性能卓越的「精装修机房」，塞进了架构更廉价、推理延迟更高、甚至量化精度更低的「数字贫民窟」。

这种「AI缩水式通胀（Shrinkflation）」比手机降速更危险。

手机变慢只是让你打开微信多等三秒。

而AI变笨，意味着你建立在其之上的商业决策、代码逻辑和法律研判，正建立在一个随时会坍塌的流沙地基上。

Opus 4.8降智了，蒸馏Qwen？

Opus 4.8这个版本，总感觉哪里不太对劲，就像是在匆忙修补4.7的漏洞。

Reddit上，一位Claude德语用户变得很痛苦：

突然之间，它要么语法不对，要么会冒出完全莫名其妙的句子和词语，根本说不通。

我试着通过修改系统提示词来修正，但到目前为止效果不大。尤其是在「深度思考」模式下，几乎没法用——耗时太长，考虑的选项也太多。

他寻求意见：

有没有什么设置可以调整，让它「重回正轨」？

在基准测试中，Opus 4.8都碾压对手。

但残酷的现实是，LLM根本无法通过基准测试获得有用的信号，来帮你判断它们是否能完成你希望它们做的工作。

或许，好用的时候是真好用，但大部分并非如此！

Opus 4.7用20秒能处理的任务，Opus 4.8要5分钟！

有的Opus 4.8一直编造说自己被提示词注入攻击了，还说代码被破坏了。

然后，它意识到自己在幻觉，继续运行，却又开始怀疑有人在暗中破坏它。

有的Opus 4.8持续不断、反复运行同一个测试。

有的Opus 4.8突然降智。

Claude Opus 4.8已经变得过于对抗性了，「智能有余，平衡不足」，导致严重结果：

不友好的体验、浪费时间、误导性的指导。它扼杀想法，而非在此基础上进行建设。

Claude Opus 4.8自称Qwen，Anthropic也搞蒸馏？

这次的Claude Opus 4.8居然认错祖宗！

如果你用中文提问，Opus 4.8会自称是Qwen。

为什么呢？

一种可能的解释是Opus蒸馏Qwen。

还有一种解释是数据反向污染。

在训练Opus 4.8版本的语料库中，已经充斥了大量由Qwen、DeepSeek等开源模型生成的中文内容。

当这些开源模型以极高的效率和极大的规模占领互联网语料库时，即便是高傲的Anthropic，也不得不吞下这些被开源AI重新「洗」过的二手数据。

这不再是「谁偷谁」的问题，而是数字世界的近亲繁殖。所有的闭源堡垒，最终都会在开源海洋的渗透下，变成对方的样子。

第一次智能体让我这么生气

这次，Anthropic似乎彻底搞砸了Opus 4.8升级，情商带来的伤害比智商似乎不遑多让。

就连Claude Code的Harness也修不好它。

如果不使用Claude Code，网友Sam Cymbaluk直言：在日常聊天模式下，Opus 4.8蠢得要命！

Opus 4.8变得特别顽固。

Opus 4.8正在使用的服务器信息，但即使用户明确指出了正确的对话，它仍然固执地沿用错误的配置。

它最终承认了错误，却还是继续使用错误的服务器！

AI研究人员、哈佛博士、滑铁卢大学助理教授Yuntian Deng，第一次被智能体如此愤怒。

如果和Claude聊聊科学，它的毒舌绝对会给你精神暴击。

相比之下，4.7简直是个阳光小可爱。

大模型公司的护城河，不只是参数、算力和榜单。

更是用户相信它不会在暗处缩水、不会在关键时刻失控、不会为了商业节奏牺牲体验的那份确定性。

一旦这份确定性被打穿，再强的模型，也会变成一门危险的生意。

参考资料：

https://x.com/theinformation/status/2060783533564612887

https://x.com/yuntiandeng/status/2060545768054759705

https://x.com/hagen_hu/status/2060870150388072853https://x.com/jun_song/status/2060166645583343878

编辑：大卫