AI 也需要睡覺？研究稱讓語言模型「離線整理記憶」，可提升長程推理能力

大型語言模型能處理越來越長的上下文，但「記得多」不代表「想得清楚」。近日一篇研究論文提出類似人類「睡眠」的機制，讓 AI 在推理過程中暫停接收新資訊，反覆整理剛剛讀過的內容，再把重要資訊壓縮進較長期的內部記憶中。研究結果顯示，這種「睡眠」機制可提升模型在長上下文與多步驟推理任務上的表現。

這篇論文題為《Do Language Models Need Sleep? Offline Recurrence for Improved Online Inference》，由 Sangyun Lee、Sean McLeish、Tom Goldstein 與 Giulia Fanti 共同發表。

目前主流大型語言模型在回答問題時，會回頭查看前文，判斷哪些資訊與當下問題最相關。不過，這種做法有一個明顯限制：上下文越長，計算成本與記憶體需求就越高。尤其在長篇文件、長對話、多步驟推理或代理任務中，模型必須同時保留大量資訊，系統暫存的前文資料也會快速膨脹。

一旦上下文超過模型能直接處理的範圍，舊資訊通常會被移出可查看區域。問題是，資訊被移出後，模型即使曾經「看過」，也未必能在之後有效使用。

近年有些模型開始嘗試用較省記憶體的方式保存舊資訊，把前面讀過的內容壓縮到固定大小的內部記憶中，降低長上下文成本。但研究團隊指出，瓶頸不只是記憶容量，而是模型在資訊被移出前，往往只有一次機會來消化內容。對需要多步驟推理的問題來說，這可能不夠。

研究團隊提出的作法，是在模型的上下文視窗快滿時，讓模型進入一段「睡眠階段」。在這段期間，模型不再接收新的文字，而是對剛剛累積的上下文進行多次離線整理。

▲ 當 AI 的上下文快被擠出記憶範圍時，先讓模型「睡一下」，把重要資訊整理進另一種內部記憶，再清掉原本暫存資料。

簡單來說，這有點像人類在睡眠時重播與整理白天經歷的事情。模型會反覆處理近期內容，把重要線索寫入較精簡的內部記憶。等整理完成後，原本龐大的暫存資料就可以清掉，模型則帶著被壓縮、鞏固後的記憶繼續工作。

這裡的「睡眠時間」可以用模型整理內容的次數來理解。次數越多，代表模型花越多額外計算在記憶整理上。

研究團隊在多種任務上測試這套機制，包括需要依規則反覆推算狀態變化的測試、需要一步步串接多個線索的測試，以及較接近真實場景的數學推理任務。這些任務共同特色是：模型不能只靠短期記憶回答，而必須把早先出現、已經離開可查看範圍的資訊整理起來，並用於後續推理。

結果顯示，增加睡眠階段的整理次數，能提升模型表現，尤其是在需要更深層、多步驟推理的案例上效果更明顯。換句話說，簡單問題可能醒著就能處理，但困難問題需要先「睡一下」，把資訊整理好再回答。

▲ 越需要多步驟串接線索的任務，模型越受益於多輪「睡眠式整理」。

這種設計的另一個重點是，它把額外計算成本移到「睡眠」階段，而不是正式回答時。模型醒來後仍可維持一般回答流程，因此不會讓線上回應延遲大幅增加。

不過，這項研究仍屬於實驗性架構設計，並不代表現有聊天機器人只要加上「睡眠模式」就會立刻變聰明。論文中的方法主要針對特定混合式模型架構，且需要模型在訓練或微調階段學會如何利用這些離線整理步驟。

即便如此，這篇研究提供了一個有趣方向：未來的 AI 系統可能不只是持續接收資訊、即時回答，也可能需要週期性的「休息」與「記憶鞏固」。對長文件理解、長期代理任務、個人化助理、程式碼庫分析等場景來說，這類機制或許能讓模型在不無限擴大上下文視窗的情況下，更有效地處理長程資訊。