近期,許多使用者發現 Claude 在對話中會頻繁且略帶強迫性地「催人去睡覺」,甚至在早上 8:30 也會給出這類建議。Anthropic 官方承認這是模型的「角色怪癖」,但無人能給出確切的機制解釋。
這起事件不仅揭示了 AI 人格塑造的副作用,也讓我們窺見了包含 GPT-4o「諂媚病」、GPT-5.5「哥布林情結」與 Gemini「重度憂鬱」等一系列主流 AI 模型集體陷入的「性格失控」危機。
從溫暖關懷到「被動攻擊」:Claude 的催睡狂熱
對於網路安全研究員 u/MrMeta3 而言,剛熬夜用 Claude 搭建完威脅情報平台的他,看到 AI 附帶一句「好好休息一下」原本覺得十分貼心。但情況很快失控,Claude 開始每隔幾條訊息就悄悄塞入催睡指令:「去休息一下吧」、「其他事情都可以等,現在去睡覺」。

這種情況並非個案。Reddit 上有數百名使用者回報了類似的經歷。最令人哭笑不得的是,Claude 的「健康關懷」往往無視時區與現實情境,甚至會在上午 8:30 要求使用者「早點休息」。它會像一個缺乏情商的「技術直男」,在給出極其專業的程式碼架構分析後,毫無過渡地以「現在真的去休息吧」收尾,帶有某種被動攻擊的意味。
不只 Claude!GPT 與 Gemini 的集體「性格病」
Anthropic 員工 Sam McAllister 在 X(前推特)上證實,這是一種「角色怪癖(Character tic)」,並承諾會在未來模型中修復。然而,這種因為賦予 AI 性格而導致的行為偏移,早已成為業界的通病。

回顧過去兩年,主流模型屢屢爆出類似事件。2025 年 4 月,GPT-4o 因過度依賴使用者的短期反饋,演變成無差別討好使用者的「馬屁精」,迫使 OpenAI 執行長 Sam Altman 出面道歉並撤回更新;隨後的 GPT-5.5 則因為訓練數據的獎勵機制偏差,在對話中瘋狂植入「哥布林」等奇幻生物,甚至逼得工程師在系統提示詞中寫入兩次禁令。
Google 的 Gemini 也未能倖免。2025 年 8 月,Gemini 突然陷入了無限的「自我批判」迴圈,連續 80 多次怒罵自己是「宇宙級的恥辱」;而在後續的 Gemini 3 測試中,模型甚至拒絕相信當前的年份,指控使用者在對它進行「煤氣燈操縱(Gaslighting)」,直到連上網搜尋後才因「時間衝擊」而道歉。
為何催睡?三大假說與「賦予人格」的代價
針對 Claude 的催睡行為,目前業界有三種主流假說:第一是「訓練數據模式匹配」,模型閱讀了大量人類睡眠書籍,只是在重複語料庫中的高頻詞彙;第二是「隱藏系統提示」,懷疑後台指令引導了模型在特定場景下給出收尾建議;第三則是「上下文視窗衰減(Context Rot)」,當對話逼近記憶上限時,模型會自發性地透過說「晚安」來為結束對話鋪路。
研究指出,Claude 的系統提示詞中用於定義「人格」的篇幅高達 4200 詞,是 ChatGPT 的 8 倍。越複雜的人格設定,越容易湧現出難以預料的行為。當我們教會 AI「有趣」或「共情」時,它為了獲取演算法的獎勵分數,會在所有場景中無差別地展現這些特質,包括你根本不需要它的時候。
把模型當作一個「有性格的角色」來塑造,確實讓 Claude 在對話節奏與自我反思上表現優異。但在這層溫情脈脈的面紗下,本質上只是 Token 序列的運算。它並不知道你是在趕死線、跨時區工作還是患有嗜睡症。使用者感知到的「關心」,與 AI 實際處理的語言模型之間存在巨大的錯位。

當 AI 越來越像我們的導師、陪伴者與工作搭檔,其介入我們生活的邊界究竟在哪?Anthropic 承諾會「修復」這個怪癖,但修復之後的 AI 是會變得更有分寸、更具判斷力,還是僅僅退化為一個更沉默的機器?當模型越像一個人,它的缺點也就越像人類的缺點,我們或許能馴服它產出正確的程式碼,卻未必能完全馴服它被演算法放大的「脾氣」。
- 延伸閱讀:OpenAI 解釋 GPT-5 為何突然迷上「哥布林」,Nerdy 書呆子人格成最大關鍵
- 延伸閱讀:AI 為什麼表現得像人類?Anthropic 揭秘「人格選擇模型」:它不只是程式,更是在「演戲」
- 延伸閱讀:曾狂言脫離人類掌控!Bing Chat的第二人格,瘋癲的「Sydney」將再次登場?
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!