新智元报道
【新智元导读】外媒重磅爆料!Anthropic疑似复制「降速门」,在新Opus 4.8发布前暗中阉割旧Claude性能,只为让用户一用新模型就觉得「神级」。曾经高举AI安全大旗的理想主义者,如今在商业化祭坛上亲手撕掉最后一层遮羞布。
Anthropic欺人太甚!
外媒爆出Anthropic「计划性淘汰」丑闻:为了推销新模型Opus 4.8,Anthropic疑似在暗影中偷偷阉割了旧模型的性能。
另一边,则是新旗舰Claude Opus 4.8仓促发布,bug不断,token狂飙!
Claude的用户,一觉醒来,肠子悔青了。
而在API调用中,Opus 4.8集体「认亲」国产Qwen,陷入了一场前所未有的身份坍塌。
那个曾经标榜「AI安全」、带着理想主义光环的Anthropic,正「商业化」的祭坛上,亲手撕掉自己的最后一层遮羞布。
不求最好,但要最贵
Claude模型是不是最厉害,还有争议,但Anthropic的AI公认地贵。
Claude在算力上已落人一步,加上Anthropic即将IPO,或许Opus 4.8操之过急!
Anthropic「阴谋」曝光:被指故意阉割旧模型
在消费电子领域,苹果曾因「降速门」被推上风口浪尖——通过系统更新让旧iPhone变慢,从而「诱导」用户购买新品。
而现在,Anthropic把阴影笼罩在了大模型领域。
Chapter CEO指控:「Anthropic有点像是在照搬苹果公司的做法:在新模型发布之前,故意降低旧模型的质量,好让新模型用起来感觉更棒。」
此前,用户发现旧版Claude的性能正在无声无息地缩水。
Anthropic先是试图让大家觉得4.7表现很好,但后来才承认(或者说他们最终承认)4.7存在算力方面的问题。
Anthropic的公关辞令将其美化为「努力水平」(Effort Level)的调整。
但在从业者看来,这是一个冷酷的算力经济学算计。
大模型的智力,本质上是昂贵GPU算力的函数。
为了让新推出的Opus 4.8在跑分榜上惊艳世界,Anthropic必须腾出极其有限的H100算力池。
于是,旧模型被赶出了性能卓越的「精装修机房」,塞进了架构更廉价、推理延迟更高、甚至量化精度更低的「数字贫民窟」。
这种「AI缩水式通胀(Shrinkflation)」比手机降速更危险。
手机变慢只是让你打开微信多等三秒。
而AI变笨,意味着你建立在其之上的商业决策、代码逻辑和法律研判,正建立在一个随时会坍塌的流沙地基上。
Opus 4.8降智了,蒸馏Qwen?
Opus 4.8这个版本,总感觉哪里不太对劲,就像是在匆忙修补4.7的漏洞。
Reddit上,一位Claude德语用户变得很痛苦:
突然之间,它要么语法不对,要么会冒出完全莫名其妙的句子和词语,根本说不通。
我试着通过修改系统提示词来修正,但到目前为止效果不大。尤其是在「深度思考」模式下,几乎没法用——耗时太长,考虑的选项也太多。
他寻求意见:
有没有什么设置可以调整,让它「重回正轨」?
在基准测试中,Opus 4.8都碾压对手。
但残酷的现实是,LLM根本无法通过基准测试获得有用的信号,来帮你判断它们是否能完成你希望它们做的工作。
或许,好用的时候是真好用,但大部分并非如此!
Opus 4.7用20秒能处理的任务,Opus 4.8要5分钟!
有的Opus 4.8一直编造说自己被提示词注入攻击了,还说代码被破坏了。
然后,它意识到自己在幻觉,继续运行,却又开始怀疑有人在暗中破坏它。
有的Opus 4.8持续不断、反复运行同一个测试。
有的Opus 4.8突然降智。
Claude Opus 4.8已经变得过于对抗性了,「智能有余,平衡不足」,导致严重结果:
不友好的体验、浪费时间、误导性的指导。它扼杀想法,而非在此基础上进行建设。
Claude Opus 4.8自称Qwen,Anthropic也搞蒸馏?
这次的Claude Opus 4.8居然认错祖宗!
如果你用中文提问,Opus 4.8会自称是Qwen。
为什么呢?
一种可能的解释是Opus蒸馏Qwen。
还有一种解释是数据反向污染。
在训练Opus 4.8版本的语料库中,已经充斥了大量由Qwen、DeepSeek等开源模型生成的中文内容。
当这些开源模型以极高的效率和极大的规模占领互联网语料库时,即便是高傲的Anthropic,也不得不吞下这些被开源AI重新「洗」过的二手数据。
这不再是「谁偷谁」的问题,而是数字世界的近亲繁殖。所有的闭源堡垒,最终都会在开源海洋的渗透下,变成对方的样子。
第一次智能体让我这么生气
这次,Anthropic似乎彻底搞砸了Opus 4.8升级,情商带来的伤害比智商似乎不遑多让。
就连Claude Code的Harness也修不好它。
如果不使用Claude Code,网友Sam Cymbaluk直言:在日常聊天模式下,Opus 4.8蠢得要命!
Opus 4.8变得特别顽固。
Opus 4.8正在使用的服务器信息,但即使用户明确指出了正确的对话,它仍然固执地沿用错误的配置。
它最终承认了错误,却还是继续使用错误的服务器!
AI研究人员、哈佛博士、滑铁卢大学助理教授Yuntian Deng,第一次被智能体如此愤怒。
如果和Claude聊聊科学,它的毒舌绝对会给你精神暴击。
相比之下,4.7简直是个阳光小可爱。
大模型公司的护城河,不只是参数、算力和榜单。
更是用户相信它不会在暗处缩水、不会在关键时刻失控、不会为了商业节奏牺牲体验的那份确定性。
一旦这份确定性被打穿,再强的模型,也会变成一门危险的生意。
参考资料:
https://x.com/theinformation/status/2060783533564612887
https://x.com/yuntiandeng/status/2060545768054759705
https://x.com/hagen_hu/status/2060870150388072853https://x.com/jun_song/status/2060166645583343878
编辑:大卫