Claude「降智」大翻車！Anthropic認了效能暴跌，急送額度補償！

對於依賴 AI 進行複雜工程任務與程式開發的專業人士而言，模型的任何邏輯降級都是一場災難。近期，AI 圈內關於 Anthropic 旗艦模型 Claude「暗中縮水」的質疑聲四起。

大量用戶反應 Claude 3.5 在處理長代碼與複雜推理時出現推理能力斷崖式下跌、幻覺頻發，且在 Token 消耗上變得極為低效。這種效能退化不僅嚴重威脅了數位員工的生產力，更讓市場開始猜測公司是否為了節省算力而故意對模型進行「降智」。

麵對外界的強烈質疑，Anthropic 終於發表長文致歉，承認產品層的三項近期調整確實導致了效能下降。雖然官方否認了故意縮水的說法，但這次風波已暴露了大模型產品化過程中的穩定性脆弱。開發者們擔心，若核心工具的性能隨時可能因微小的參數調整而波動，將無法建立起穩固的長期自動化工作流，這場信賴危機已迫使 Anthropic 必須採取激進的透明化行動來挽回品牌聲譽。

推理下調、快取漏洞與提示詞冗餘限制的三重夾擊

Anthropic 的技術覆盤報告揭示了導致「智力退化」的三個具體 Bug。

首先，為了緩解使用者介面（UI）的延遲問題，官方在 3 月 4 日將 Claude Code 的預設推理力度從「高」調至「中」，直接導致複雜任務的邏輯分析受限。

其次，3 月 26 日部署的快取優化方案存在嚴重缺陷，導致模型在每輪對話後都會誤刪「短期記憶」與思考過程，造成上下文資訊的丟失與重複。

最後，4 月 16 日為了解決回覆過於冗長的問題，系統強制將工具調用間的文字限制在 25 到 100 個單詞內，卻意外導致模型在程式品質評估中得分下滑了 3%。

這些問題主要波及了 Claude Code 命令行界面、Agent SDK 以及 Claude Cowork 等專業工具，雖然 Claude API 業務未受影響，但已對開發者社群造成了顯著的「性能摩擦」。為了修正這些機制性錯誤，Anthropic 不僅修復了漏洞，更宣布將優化提示詞變更的審計流程。未來，任何系統提示詞的修改都必須強制執行更廣泛的「消融實驗（Ablations）」，以精準隔離特定指令對模型行為的影響，確保在追求效率的同時不會犧牲核心的推理精度。