FB 建議貼文

選取貼文複製成功(包含文章連結)!

Claude「降智」大翻車!Anthropic認了效能暴跌,急送額度補償!

Claude「降智」大翻車!Anthropic認了效能暴跌,急送額度補償!

對於依賴 AI 進行複雜工程任務與程式開發的專業人士而言,模型的任何邏輯降級都是一場災難。近期,AI 圈內關於 Anthropic 旗艦模型 Claude「暗中縮水」的質疑聲四起。

大量用戶反應 Claude 3.5 在處理長代碼與複雜推理時出現推理能力斷崖式下跌、幻覺頻發,且在 Token 消耗上變得極為低效。這種效能退化不僅嚴重威脅了數位員工的生產力,更讓市場開始猜測公司是否為了節省算力而故意對模型進行「降智」。

麵對外界的強烈質疑,Anthropic 終於發表長文致歉,承認產品層的三項近期調整確實導致了效能下降。雖然官方否認了故意縮水的說法,但這次風波已暴露了大模型產品化過程中的穩定性脆弱。開發者們擔心,若核心工具的性能隨時可能因微小的參數調整而波動,將無法建立起穩固的長期自動化工作流,這場信賴危機已迫使 Anthropic 必須採取激進的透明化行動來挽回品牌聲譽。

推理下調、快取漏洞與提示詞冗餘限制的三重夾擊

Anthropic 的技術覆盤報告揭示了導致「智力退化」的三個具體 Bug。

首先,為了緩解使用者介面(UI)的延遲問題,官方在 3 月 4 日將 Claude Code 的預設推理力度從「高」調至「中」,直接導致複雜任務的邏輯分析受限。

其次,3 月 26 日部署的快取優化方案存在嚴重缺陷,導致模型在每輪對話後都會誤刪「短期記憶」與思考過程,造成上下文資訊的丟失與重複。

最後,4 月 16 日為了解決回覆過於冗長的問題,系統強制將工具調用間的文字限制在 25 到 100 個單詞內,卻意外導致模型在程式品質評估中得分下滑了 3%。

這些問題主要波及了 Claude Code 命令行界面、Agent SDK 以及 Claude Cowork 等專業工具,雖然 Claude API 業務未受影響,但已對開發者社群造成了顯著的「性能摩擦」。為了修正這些機制性錯誤,Anthropic 不僅修復了漏洞,更宣布將優化提示詞變更的審計流程。未來,任何系統提示詞的修改都必須強制執行更廣泛的「消融實驗(Ablations)」,以精準隔離特定指令對模型行為的影響,確保在追求效率的同時不會犧牲核心的推理精度。

Token 重置補償與運營機制改革的透明化典範

為了恢復市場信任並安撫受損的訂閱用戶,Anthropic 展現了誠意十足的補償措施。公司已於 4 月 23 日正式重置了所有訂閱使用者的 Token 額度,以抵消因 Bug 導致的 Token 浪費。

此外,Anthropic 宣布實施多項運營機制改革,包括擴大「內部測試(Dogfooding)」範圍,要求更大比例的員工強制使用公眾版的 Claude Code,以確保員工與用戶的體驗完全同步。這項改革旨在防範類似事件再次發生,確保任何產品端的微調都能在真實場景下得到充分驗證。

長遠來看,這場風波將促使 AI 產業建立更完善的壓力測試標準。Anthropic 承諾後續將透過 X 和 GitHub 上的官方帳號,提供產品決策背後的深層邏輯,維持與開發者群體更透明的對話。

 

 

 

janus
作者

PC home雜誌、T客邦產業編輯,曾為多家科技雜誌撰寫專題文章,主要負責作業系統、軟體、電商、資安、A以及大數據、IT領域的取材以及報導,以及軟體相關教學報導。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則