大型語言模型能處理越來越長的上下文,但「記得多」不代表「想得清楚」。近日一篇研究論文提出類似人類「睡眠」的機制,讓 AI 在推理過程中暫停接收新資訊,反覆整理剛剛讀過的內容,再把重要資訊壓縮進較長期的內部記憶中。研究結果顯示,這種「睡眠」機制可提升模型在長上下文與多步驟推理任務上的表現。
這篇論文題為《Do Language Models Need Sleep? Offline Recurrence for Improved Online Inference》,由 Sangyun Lee、Sean McLeish、Tom Goldstein 與 Giulia Fanti 共同發表。

為什麼 AI 需要「睡覺」?
目前主流大型語言模型在回答問題時,會回頭查看前文,判斷哪些資訊與當下問題最相關。不過,這種做法有一個明顯限制:上下文越長,計算成本與記憶體需求就越高。尤其在長篇文件、長對話、多步驟推理或代理任務中,模型必須同時保留大量資訊,系統暫存的前文資料也會快速膨脹。
一旦上下文超過模型能直接處理的範圍,舊資訊通常會被移出可查看區域。問題是,資訊被移出後,模型即使曾經「看過」,也未必能在之後有效使用。
近年有些模型開始嘗試用較省記憶體的方式保存舊資訊,把前面讀過的內容壓縮到固定大小的內部記憶中,降低長上下文成本。但研究團隊指出,瓶頸不只是記憶容量,而是模型在資訊被移出前,往往只有一次機會來消化內容。對需要多步驟推理的問題來說,這可能不夠。
模型「睡覺」時在做什麼?
研究團隊提出的作法,是在模型的上下文視窗快滿時,讓模型進入一段「睡眠階段」。在這段期間,模型不再接收新的文字,而是對剛剛累積的上下文進行多次離線整理。

簡單來說,這有點像人類在睡眠時重播與整理白天經歷的事情。模型會反覆處理近期內容,把重要線索寫入較精簡的內部記憶。等整理完成後,原本龐大的暫存資料就可以清掉,模型則帶著被壓縮、鞏固後的記憶繼續工作。
這裡的「睡眠時間」可以用模型整理內容的次數來理解。次數越多,代表模型花越多額外計算在記憶整理上。
睡越久,推理越好?
研究團隊在多種任務上測試這套機制,包括需要依規則反覆推算狀態變化的測試、需要一步步串接多個線索的測試,以及較接近真實場景的數學推理任務。這些任務共同特色是:模型不能只靠短期記憶回答,而必須把早先出現、已經離開可查看範圍的資訊整理起來,並用於後續推理。
結果顯示,增加睡眠階段的整理次數,能提升模型表現,尤其是在需要更深層、多步驟推理的案例上效果更明顯。換句話說,簡單問題可能醒著就能處理,但困難問題需要先「睡一下」,把資訊整理好再回答。

這種設計的另一個重點是,它把額外計算成本移到「睡眠」階段,而不是正式回答時。模型醒來後仍可維持一般回答流程,因此不會讓線上回應延遲大幅增加。
不是讓 ChatGPT 真的去睡覺
不過,這項研究仍屬於實驗性架構設計,並不代表現有聊天機器人只要加上「睡眠模式」就會立刻變聰明。論文中的方法主要針對特定混合式模型架構,且需要模型在訓練或微調階段學會如何利用這些離線整理步驟。
即便如此,這篇研究提供了一個有趣方向:未來的 AI 系統可能不只是持續接收資訊、即時回答,也可能需要週期性的「休息」與「記憶鞏固」。對長文件理解、長期代理任務、個人化助理、程式碼庫分析等場景來說,這類機制或許能讓模型在不無限擴大上下文視窗的情況下,更有效地處理長程資訊。
資料來源:Do Language Models Need Sleep? Offline Recurrence for Improved Online Inference
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!