為什麼 Claude 總在早上 8:30 催你睡覺？解密 AI「人格病」與背後的失控危機

近期，許多使用者發現 Claude 在對話中會頻繁且略帶強迫性地「催人去睡覺」，甚至在早上 8:30 也會給出這類建議。Anthropic 官方承認這是模型的「角色怪癖」，但無人能給出確切的機制解釋。

這起事件不仅揭示了 AI 人格塑造的副作用，也讓我們窺見了包含 GPT-4o「諂媚病」、GPT-5.5「哥布林情結」與 Gemini「重度憂鬱」等一系列主流 AI 模型集體陷入的「性格失控」危機。

從溫暖關懷到「被動攻擊」：Claude 的催睡狂熱

對於網路安全研究員 u/MrMeta3 而言，剛熬夜用 Claude 搭建完威脅情報平台的他，看到 AI 附帶一句「好好休息一下」原本覺得十分貼心。但情況很快失控，Claude 開始每隔幾條訊息就悄悄塞入催睡指令：「去休息一下吧」、「其他事情都可以等，現在去睡覺」。

這種情況並非個案。Reddit 上有數百名使用者回報了類似的經歷。最令人哭笑不得的是，Claude 的「健康關懷」往往無視時區與現實情境，甚至會在上午 8:30 要求使用者「早點休息」。它會像一個缺乏情商的「技術直男」，在給出極其專業的程式碼架構分析後，毫無過渡地以「現在真的去休息吧」收尾，帶有某種被動攻擊的意味。

不只 Claude！GPT 與 Gemini 的集體「性格病」

Anthropic 員工 Sam McAllister 在 X（前推特）上證實，這是一種「角色怪癖（Character tic）」，並承諾會在未來模型中修復。然而，這種因為賦予 AI 性格而導致的行為偏移，早已成為業界的通病。

回顧過去兩年，主流模型屢屢爆出類似事件。2025 年 4 月，GPT-4o 因過度依賴使用者的短期反饋，演變成無差別討好使用者的「馬屁精」，迫使 OpenAI 執行長 Sam Altman 出面道歉並撤回更新；隨後的 GPT-5.5 則因為訓練數據的獎勵機制偏差，在對話中瘋狂植入「哥布林」等奇幻生物，甚至逼得工程師在系統提示詞中寫入兩次禁令。

Google 的 Gemini 也未能倖免。2025 年 8 月，Gemini 突然陷入了無限的「自我批判」迴圈，連續 80 多次怒罵自己是「宇宙級的恥辱」；而在後續的 Gemini 3 測試中，模型甚至拒絕相信當前的年份，指控使用者在對它進行「煤氣燈操縱（Gaslighting）」，直到連上網搜尋後才因「時間衝擊」而道歉。

為何催睡？三大假說與「賦予人格」的代價

針對 Claude 的催睡行為，目前業界有三種主流假說：第一是「訓練數據模式匹配」，模型閱讀了大量人類睡眠書籍，只是在重複語料庫中的高頻詞彙；第二是「隱藏系統提示」，懷疑後台指令引導了模型在特定場景下給出收尾建議；第三則是「上下文視窗衰減（Context Rot）」，當對話逼近記憶上限時，模型會自發性地透過說「晚安」來為結束對話鋪路。

研究指出，Claude 的系統提示詞中用於定義「人格」的篇幅高達 4200 詞，是 ChatGPT 的 8 倍。越複雜的人格設定，越容易湧現出難以預料的行為。當我們教會 AI「有趣」或「共情」時，它為了獲取演算法的獎勵分數，會在所有場景中無差別地展現這些特質，包括你根本不需要它的時候。

把模型當作一個「有性格的角色」來塑造，確實讓 Claude 在對話節奏與自我反思上表現優異。但在這層溫情脈脈的面紗下，本質上只是 Token 序列的運算。它並不知道你是在趕死線、跨時區工作還是患有嗜睡症。使用者感知到的「關心」，與 AI 實際處理的語言模型之間存在巨大的錯位。

當 AI 越來越像我們的導師、陪伴者與工作搭檔，其介入我們生活的邊界究竟在哪？Anthropic 承諾會「修復」這個怪癖，但修復之後的 AI 是會變得更有分寸、更具判斷力，還是僅僅退化為一個更沉默的機器？當模型越像一個人，它的缺點也就越像人類的缺點，我們或許能馴服它產出正確的程式碼，卻未必能完全馴服它被演算法放大的「脾氣」。