TECH ARTICLES
Claude Anthropic AI 争议

Claude "降智"风波:你的 AI 变笨了,还是有人偷偷拧小了水龙头?

Jackie Zhan 2026-04-20
目录
"降智"到底是一种什么感受? AMD 的 23 万次调用,揭开了什么? 三个"静悄悄"的改动:不是菜变了,是盘子变小了 官方回应为什么没人买账? 订阅制 AI 的不可能三角 你该怎么办?

上周有个同事发消息问我:"你有没有觉得 Claude 最近变笨了?"

我反问他:"怎么个笨法?"

他说:"以前让它改个 bug,它会先看完相关代码再动手。现在呢?直接上来就改,改完一跑,到处报错。就像一个实习生,以前还认真做笔记,现在直接拍脑袋。"

我说:"你不是一个人。"

过去两个月,Twitter、GitHub、Reddit 上,关于"Claude 变笨了"的讨论像潮水一样涌来。有人说是幻觉,有人说是阴谋,有人甩出了 23 万次 API 调用的数据分析。

到底发生了什么?今天我们来一层一层揭开这个谜。


"降智"到底是一种什么感受?

先说清楚"降智"是什么。

它不是 Claude 不能用了,也不是它开始胡说八道。而是一种更微妙的退化——它变"浅"了

以前你让 Claude Code 帮你重构一个模块,它会先花时间读完所有相关文件,理清依赖关系,然后给你一个深思熟虑的方案。现在呢?它看两眼就动手,改完之后你发现它漏掉了三个关联文件。

打个比方:你去找一个老中医看病。以前他望闻问切,把脉五分钟,开方子考虑各种禁忌。突然有一天,他摸了一下你的手腕,两秒钟就开方子了。药还是那些药,但你心里犯嘀咕——这个方子,他真的"想过"吗?

用户的体感非常统一:

如果只有一两个人这么说,可能是错觉。但当 Twitter 上每天都有开发者晒出"before vs after"的对比截图时,你就知道这不是心理作用了。

常见误解
"降智"不是说模型的参数被删了、权重被改了。模型本身可能一点没变。问题出在模型和你之间那层"看不见的手"——运行时配置层。你付的钱没变,水压却变了。

但"感觉变笨了"是一回事,"真的变笨了"是另一回事。有没有人拿数据说话?

还真有。而且来头不小。

AMD 的 23 万次调用,揭开了什么?

2026 年 4 月 2 日,一个名叫 Stella Laurenzo 的人在 GitHub 上发了一篇长帖。

她不是普通用户——她是 AMD AI 组的高级总监,负责 AI 编译器和开发工具。换句话说,她自己就是做 AI 底层基础设施的。

她做了一件大多数人做不到的事:把自己几个月的 Claude Code 使用记录全部导出来,做了一次完整的逆向审计

数据量是这样的:

她算了一笔账:按标准 API 价格,这些用量每月值 42,121 美元。而她的订阅费?每月 400 美元。一个 122 倍的差距。

数据说话
Laurenzo 的分析显示:2026 年 1 月,Claude Code 在修改代码之前平均会读取 6.6 个文件。到了 3 月底,这个数字跌到了 2 个。降幅超过 70%。模型从"先研究再动手"的工程师,退化成了"先改再说"的实习生。

更关键的发现是:这种退化不是渐进式的,而是阶梯式的。每一次跳变,都对应着 Anthropic 在后台做的一次配置修改。

数据不会撒谎。但数据需要有人会读。Laurenzo 读出了三个关键的时间节点。

这就是故事真正精彩的地方。

三个"静悄悄"的改动:不是菜变了,是盘子变小了

Laurenzo 的分析指出了三个精确的日期,每个日期对应 Anthropic 的一次"静默更新":

2月9日 引入 Adaptive Thinking 模型自行决定思考时长 3月3日 默认 effort: high → medium 推理深度被腰斩 3月5日 隐藏 thinking 输出 用户无法察觉思考过程
Anthropic 在 2026 年 2-3 月的三次"静默更新"时间线

我来逐个拆解。

第一刀:Adaptive Thinking(2 月 9 日)

这个改动的意思是:模型不再对每个问题投入同样的思考力度,而是自己判断这个问题需要想多久

听起来很合理对吧?简单问题少想,复杂问题多想,省时省钱。

问题在于:模型对"这个问题有多复杂"的判断,经常是错的

很多资深工程师的任务,表面上看起来简单——"帮我重构一下这个函数"。但实际上,这个函数可能牵扯到五个模块的依赖、三个边界条件和一个历史遗留 bug。模型看了一眼觉得"哦,就改个函数嘛",分配了最低思考预算,甚至在某些回合直接分配了零思考预算

打个比方:你让一个医生看病,他现在有权自己决定要不要做检查。感冒?不检查了,直接开药。问题是,有些"看起来像感冒"的病,可能是肺炎。

第二刀:默认 Effort 从 High 降到 Medium(3 月 3 日)

这一刀才是真正的"降智元凶"。

Anthropic 的 Claude Code 有一个 effort 参数,控制模型每次回答时的推理深度。之前默认是 high,3 月 3 日被改成了 medium

这就像你去自助餐厅,以前盘子是大盘,现在换成了小碟子。食物还是那些食物,但你每次能拿的量少了一半。吃完一碟你可以再去拿,但大多数人不会——因为你甚至不知道盘子变小了

第三刀:隐藏思考过程(3 月 5 日)

Anthropic 添加了一个名为 redact-thinking-2026-02-12 的 HTTP 头,让 Claude Code 不再将思考过程返回到本地日志中。

官方说法是:这只是一个 UI 优化,减少延迟,"不影响思考本身"。

但结果是:用户失去了验证模型是否在认真思考的唯一窗口。你再也看不到模型有没有在"想",只能看到它的输出。

关键区别
这三个改动都不是模型层面的变化——Claude Opus 4.6 的参数和权重没有被修改。真正变的是模型和用户之间那层运行时配置。不是厨师换了,是餐厅偷偷把火调小了。

三刀下去,效果叠加:模型自己决定少想,默认参数又把思考上限压低,最后你连它在不在想都看不到了。

完美的"隐形降级"。

但 Anthropic 不这么认为。

官方回应为什么没人买账?

Laurenzo 的帖子发出后,Claude Code 的负责人 Boris Cherny 亲自下场回应了。

Cherny 的核心论点是:

"我们没有削弱模型。我们只是根据用户反馈,调低了默认的努力程度。很多用户之前抱怨 Claude 消耗 Token 太多、太慢。你随时可以通过 /effort high 调回来。"
—— Boris Cherny, Claude Code 负责人

技术上说,这段话没有错

但用户不买账。原因有三:

第一,没有人告诉用户。这三个改动没有出现在任何显著的 release notes 中。一个直接影响产品核心体验的参数变更,就这么静悄悄地上线了。你投诉网速变慢了,运营商说"我们调了你的套餐,但你可以打电话改回来"——问题是,你根本不知道套餐被改了。

第二,"你可以调回来"是一个伪解决方案。大多数用户根本不知道 /effort 这个命令的存在。知道的人也不知道默认值被改了。让用户自己去挖配置项来恢复原有体验,这不叫"用户可以选择",这叫"把责任推给用户"。

第三,这打破了 Anthropic 的品牌承诺。Anthropic 一直以来的定位是"最透明、最注重安全"的 AI 公司。当你的核心差异化是"我们比 OpenAI 更值得信任"时,一次隐蔽的性能缩水,杀伤力比竞争对手做同样的事大十倍。

insider 视角
据 Fortune 报道,Anthropic 近期估值已达 3800 亿美元,正在筹备 IPO。年化收入 300 亿美元。在这个节骨眼上爆发信任危机,时机不能更糟。OpenAI 的收入负责人甚至公开暗示,Anthropic "在算力储备上犯了战略失误"。

Cherny 后来做了让步:承诺为 Teams 和 Enterprise 用户将默认 effort 恢复为 high。但对 Pro 和 Max 用户——也就是最广泛的付费群体——没有任何变化。

信任一旦裂开,用户会拿放大镜看你的每一个细节。

但如果我们跳出情绪,冷静想一个问题:Anthropic 为什么要这么做?他们疯了吗?得罪用户对他们有什么好处?

答案藏在一道数学题里。

订阅制 AI 的不可能三角

还记得 Laurenzo 算的那笔账吗?她每月付 400 美元,实际用了价值 42,121 美元的算力。122 倍。

这不是个例。有报道指出,一个 200 美元/月的 Claude Max 订阅用户,可能跑出价值 1,000 到 5,000 美元的计算任务。

这就是订阅制 AI 的根本困境。

想象一下你开了一家健身房。你卖 200 元/月的会员卡,赌的是大多数人办了卡不怎么来。前三年确实如此。然后突然有一天,所有会员都开始每天来练三小时,而且每个人都要用最贵的器械。

你怎么办?

你有三个选择:

  1. 涨价——但用户会跑
  2. 扩容——但 GPU 不是一夜之间长出来的
  3. 偷偷降低服务质量——把跑步机的最高速度从 20 调到 15

Anthropic 选了第三条路。或者更准确地说,他们选了第三条路,但不承认

推理质量 订阅价格 用户规模 最多选两个 低价 + 好质量 = 服务不了多少人 好质量 + 多用户 = 必须涨价 低价 + 多用户 = 只能降质量
订阅制 AI 的"不可能三角":推理质量、订阅价格、用户规模——最多选两个

事实上,Anthropic 不是唯一面临这个困境的公司。

2026 年 3 月底,Anthropic 公开调整了 Claude 的使用额度——高峰时段(太平洋时间早 5 点到 11 点),所有订阅层级的 5 小时会话配额都会加速消耗。影响了约 7% 的用户。

更激进的是,Anthropic 直接封禁了通过第三方代理(如 OpenClaw)无限调用 Claude 的路径,把这些用户推向按量付费。

有一个独立监测网站叫 "AI Stupid Level",专门追踪各家 AI 模型的实时性能波动。它的存在本身就说明了一个问题:用户已经不信任 AI 公司对自家产品质量的自我评估了

所有包月 AI 的噩梦,不是用户不来,而是用户真的用起来了。

你该怎么办?

讲到这里,回到最实际的问题:作为用户,你能做什么?

立刻能做的三件事

第一,手动调高 effort 级别。在 Claude Code 中输入 /effort high/effort max。这个设置是"粘性"的,会持续到下次会话。这一步能恢复大部分被"缩水"的推理深度。

# 在 Claude Code 中设置最大推理深度
/effort max

# 或者通过环境变量禁用 adaptive thinking
export CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1

第二,在提示词中显式要求深度思考。告诉 Claude "先列出所有相关文件,再制定修改方案,最后再动手"。这会让模型的自适应机制把更多预算分配给推理。

第三,不要把鸡蛋放在一个篮子里。如果你的工作流对 AI 编程助手有强依赖,确保你对 Cursor、GitHub Copilot 或 Windsurf 有基本的熟悉度。不是说要换,而是要有 Plan B。


现在,让我们退一步,看看这场争议的全貌。

关于"AI 公司是否应该在订阅框架内静默调整服务质量",技术圈有两派泾渭分明的声音:

"务实派"说:这是正常的产品运营。没有哪家 SaaS 公司不做资源调度。Netflix 在高峰期降码率,AWS 在过载时限流,这些都是行业惯例。Anthropic 需要在成本和体验之间找平衡,而且他们提供了手动覆盖的选项。用户要做的只是学会调参数。

"信任派"说:AI 不是流媒体。视频降码率你眼睛看得出来,但推理深度的缩水,用户可能几周后才从线上 bug 里发现。更重要的是,Anthropic 是靠"我们比竞争对手更透明"起家的。如果你的品牌就是信任,那隐蔽的降级就是最大的品牌自杀。至少,改之前发个通知,这不过分吧?

我的立场:我站"信任派",但带一个前提条件。

我理解 Anthropic 的成本压力是真实的。122 倍的成本倒挂,任何公司都扛不住。但解决成本问题的方式,应该是公开调价或分级服务,而不是在暗处拧水龙头。

你可以把自助餐改成限量供应,但你得在门口挂个牌子。

这场风波给所有 AI 从业者提了一个醒:当 AI 成为工作流的基础设施,它的可靠性就不再是"体验问题",而是"信任问题"。而信任,是这个行业最稀缺、也最脆弱的资产。

与其抱怨 AI 变笨了,不如想想——你的工作流,有没有 Plan B?