Claude "降智"风波:你的 AI 变笨了,还是有人偷偷拧小了水龙头?
上周有个同事发消息问我:"你有没有觉得 Claude 最近变笨了?"
我反问他:"怎么个笨法?"
他说:"以前让它改个 bug,它会先看完相关代码再动手。现在呢?直接上来就改,改完一跑,到处报错。就像一个实习生,以前还认真做笔记,现在直接拍脑袋。"
我说:"你不是一个人。"
过去两个月,Twitter、GitHub、Reddit 上,关于"Claude 变笨了"的讨论像潮水一样涌来。有人说是幻觉,有人说是阴谋,有人甩出了 23 万次 API 调用的数据分析。
到底发生了什么?今天我们来一层一层揭开这个谜。
"降智"到底是一种什么感受?
先说清楚"降智"是什么。
它不是 Claude 不能用了,也不是它开始胡说八道。而是一种更微妙的退化——它变"浅"了。
以前你让 Claude Code 帮你重构一个模块,它会先花时间读完所有相关文件,理清依赖关系,然后给你一个深思熟虑的方案。现在呢?它看两眼就动手,改完之后你发现它漏掉了三个关联文件。
打个比方:你去找一个老中医看病。以前他望闻问切,把脉五分钟,开方子考虑各种禁忌。突然有一天,他摸了一下你的手腕,两秒钟就开方子了。药还是那些药,但你心里犯嘀咕——这个方子,他真的"想过"吗?
用户的体感非常统一:
- 思考变浅了:复杂问题不再深入推理,直接给出"最简修复"
- 研究变少了:改代码之前读的文件数量大幅减少
- 指令跟随变差了:不再严格遵守 CLAUDE.md 里的规则
- 循环变多了:陷入"试错-报错-再试"的死循环,而不是一步到位
如果只有一两个人这么说,可能是错觉。但当 Twitter 上每天都有开发者晒出"before vs after"的对比截图时,你就知道这不是心理作用了。
但"感觉变笨了"是一回事,"真的变笨了"是另一回事。有没有人拿数据说话?
还真有。而且来头不小。
AMD 的 23 万次调用,揭开了什么?
2026 年 4 月 2 日,一个名叫 Stella Laurenzo 的人在 GitHub 上发了一篇长帖。
她不是普通用户——她是 AMD AI 组的高级总监,负责 AI 编译器和开发工具。换句话说,她自己就是做 AI 底层基础设施的。
她做了一件大多数人做不到的事:把自己几个月的 Claude Code 使用记录全部导出来,做了一次完整的逆向审计。
数据量是这样的:
- 6,852 个会话文件
- 17,871 个思考块(thinking blocks)
- 234,760 次工具调用
她算了一笔账:按标准 API 价格,这些用量每月值 42,121 美元。而她的订阅费?每月 400 美元。一个 122 倍的差距。
更关键的发现是:这种退化不是渐进式的,而是阶梯式的。每一次跳变,都对应着 Anthropic 在后台做的一次配置修改。
数据不会撒谎。但数据需要有人会读。Laurenzo 读出了三个关键的时间节点。
这就是故事真正精彩的地方。
三个"静悄悄"的改动:不是菜变了,是盘子变小了
Laurenzo 的分析指出了三个精确的日期,每个日期对应 Anthropic 的一次"静默更新":
我来逐个拆解。
第一刀:Adaptive Thinking(2 月 9 日)
这个改动的意思是:模型不再对每个问题投入同样的思考力度,而是自己判断这个问题需要想多久。
听起来很合理对吧?简单问题少想,复杂问题多想,省时省钱。
问题在于:模型对"这个问题有多复杂"的判断,经常是错的。
很多资深工程师的任务,表面上看起来简单——"帮我重构一下这个函数"。但实际上,这个函数可能牵扯到五个模块的依赖、三个边界条件和一个历史遗留 bug。模型看了一眼觉得"哦,就改个函数嘛",分配了最低思考预算,甚至在某些回合直接分配了零思考预算。
打个比方:你让一个医生看病,他现在有权自己决定要不要做检查。感冒?不检查了,直接开药。问题是,有些"看起来像感冒"的病,可能是肺炎。
第二刀:默认 Effort 从 High 降到 Medium(3 月 3 日)
这一刀才是真正的"降智元凶"。
Anthropic 的 Claude Code 有一个 effort 参数,控制模型每次回答时的推理深度。之前默认是 high,3 月 3 日被改成了 medium。
这就像你去自助餐厅,以前盘子是大盘,现在换成了小碟子。食物还是那些食物,但你每次能拿的量少了一半。吃完一碟你可以再去拿,但大多数人不会——因为你甚至不知道盘子变小了。
第三刀:隐藏思考过程(3 月 5 日)
Anthropic 添加了一个名为 redact-thinking-2026-02-12 的 HTTP 头,让 Claude Code 不再将思考过程返回到本地日志中。
官方说法是:这只是一个 UI 优化,减少延迟,"不影响思考本身"。
但结果是:用户失去了验证模型是否在认真思考的唯一窗口。你再也看不到模型有没有在"想",只能看到它的输出。
三刀下去,效果叠加:模型自己决定少想,默认参数又把思考上限压低,最后你连它在不在想都看不到了。
完美的"隐形降级"。
但 Anthropic 不这么认为。
官方回应为什么没人买账?
Laurenzo 的帖子发出后,Claude Code 的负责人 Boris Cherny 亲自下场回应了。
Cherny 的核心论点是:
"我们没有削弱模型。我们只是根据用户反馈,调低了默认的努力程度。很多用户之前抱怨 Claude 消耗 Token 太多、太慢。你随时可以通过 /effort high 调回来。"
—— Boris Cherny, Claude Code 负责人
技术上说,这段话没有错。
但用户不买账。原因有三:
第一,没有人告诉用户。这三个改动没有出现在任何显著的 release notes 中。一个直接影响产品核心体验的参数变更,就这么静悄悄地上线了。你投诉网速变慢了,运营商说"我们调了你的套餐,但你可以打电话改回来"——问题是,你根本不知道套餐被改了。
第二,"你可以调回来"是一个伪解决方案。大多数用户根本不知道 /effort 这个命令的存在。知道的人也不知道默认值被改了。让用户自己去挖配置项来恢复原有体验,这不叫"用户可以选择",这叫"把责任推给用户"。
第三,这打破了 Anthropic 的品牌承诺。Anthropic 一直以来的定位是"最透明、最注重安全"的 AI 公司。当你的核心差异化是"我们比 OpenAI 更值得信任"时,一次隐蔽的性能缩水,杀伤力比竞争对手做同样的事大十倍。
Cherny 后来做了让步:承诺为 Teams 和 Enterprise 用户将默认 effort 恢复为 high。但对 Pro 和 Max 用户——也就是最广泛的付费群体——没有任何变化。
信任一旦裂开,用户会拿放大镜看你的每一个细节。
但如果我们跳出情绪,冷静想一个问题:Anthropic 为什么要这么做?他们疯了吗?得罪用户对他们有什么好处?
答案藏在一道数学题里。
订阅制 AI 的不可能三角
还记得 Laurenzo 算的那笔账吗?她每月付 400 美元,实际用了价值 42,121 美元的算力。122 倍。
这不是个例。有报道指出,一个 200 美元/月的 Claude Max 订阅用户,可能跑出价值 1,000 到 5,000 美元的计算任务。
这就是订阅制 AI 的根本困境。
想象一下你开了一家健身房。你卖 200 元/月的会员卡,赌的是大多数人办了卡不怎么来。前三年确实如此。然后突然有一天,所有会员都开始每天来练三小时,而且每个人都要用最贵的器械。
你怎么办?
你有三个选择:
- 涨价——但用户会跑
- 扩容——但 GPU 不是一夜之间长出来的
- 偷偷降低服务质量——把跑步机的最高速度从 20 调到 15
Anthropic 选了第三条路。或者更准确地说,他们选了第三条路,但不承认。
事实上,Anthropic 不是唯一面临这个困境的公司。
2026 年 3 月底,Anthropic 公开调整了 Claude 的使用额度——高峰时段(太平洋时间早 5 点到 11 点),所有订阅层级的 5 小时会话配额都会加速消耗。影响了约 7% 的用户。
更激进的是,Anthropic 直接封禁了通过第三方代理(如 OpenClaw)无限调用 Claude 的路径,把这些用户推向按量付费。
有一个独立监测网站叫 "AI Stupid Level",专门追踪各家 AI 模型的实时性能波动。它的存在本身就说明了一个问题:用户已经不信任 AI 公司对自家产品质量的自我评估了。
所有包月 AI 的噩梦,不是用户不来,而是用户真的用起来了。
你该怎么办?
讲到这里,回到最实际的问题:作为用户,你能做什么?
立刻能做的三件事
第一,手动调高 effort 级别。在 Claude Code 中输入 /effort high 或 /effort max。这个设置是"粘性"的,会持续到下次会话。这一步能恢复大部分被"缩水"的推理深度。
# 在 Claude Code 中设置最大推理深度
/effort max
# 或者通过环境变量禁用 adaptive thinking
export CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1
第二,在提示词中显式要求深度思考。告诉 Claude "先列出所有相关文件,再制定修改方案,最后再动手"。这会让模型的自适应机制把更多预算分配给推理。
第三,不要把鸡蛋放在一个篮子里。如果你的工作流对 AI 编程助手有强依赖,确保你对 Cursor、GitHub Copilot 或 Windsurf 有基本的熟悉度。不是说要换,而是要有 Plan B。
现在,让我们退一步,看看这场争议的全貌。
关于"AI 公司是否应该在订阅框架内静默调整服务质量",技术圈有两派泾渭分明的声音:
"务实派"说:这是正常的产品运营。没有哪家 SaaS 公司不做资源调度。Netflix 在高峰期降码率,AWS 在过载时限流,这些都是行业惯例。Anthropic 需要在成本和体验之间找平衡,而且他们提供了手动覆盖的选项。用户要做的只是学会调参数。
"信任派"说:AI 不是流媒体。视频降码率你眼睛看得出来,但推理深度的缩水,用户可能几周后才从线上 bug 里发现。更重要的是,Anthropic 是靠"我们比竞争对手更透明"起家的。如果你的品牌就是信任,那隐蔽的降级就是最大的品牌自杀。至少,改之前发个通知,这不过分吧?
我的立场:我站"信任派",但带一个前提条件。
我理解 Anthropic 的成本压力是真实的。122 倍的成本倒挂,任何公司都扛不住。但解决成本问题的方式,应该是公开调价或分级服务,而不是在暗处拧水龙头。
你可以把自助餐改成限量供应,但你得在门口挂个牌子。
这场风波给所有 AI 从业者提了一个醒:当 AI 成为工作流的基础设施,它的可靠性就不再是"体验问题",而是"信任问题"。而信任,是这个行业最稀缺、也最脆弱的资产。
与其抱怨 AI 变笨了,不如想想——你的工作流,有没有 Plan B?
参考资料
- The Claude Code Nerf: An Invisible, Unilateral Downgrade at the Runtime Layer
- Anthropic faces user backlash over reported performance issues with its Claude AI chatbot - Fortune
- Claude Code has become dumber, lazier: AMD director - The Register
- Claude 越更越废?AMD AI 负责人甩出 23 万次调用记录 - CSDN
- Claude 又又又又降智了,只有它自己不知道 - 36氪
- Claude Rate Limits Expose AI Subscription Pricing Crisis - Implicator
- Adaptive thinking - Claude API Docs
- Anthropic's AI downgrade stings power users - Axios