在 AI 運算資源動輒需要數百 GB 顯示記憶體、萬億級參數模型的時代,竟然有人讓 1976 年問世的 8 位元處理器也學會了 AI 聊天。開發者 HarryR 打造了一個名為「Z80-μLM」的計畫,在僅有 64KB 記憶體、完全沒有浮點運算能力的古董 Zilog Z80 硬體上,成功執行了對話式 AI,甚至還能玩猜謎遊戲。

壓縮術極致:40KB 塞進完整 AI 引擎
HarryR 這項被社群稱為「不可能任務」的計畫,將整個推論引擎、模型權重以及聊天介面,全部壓縮進一個僅約 40KB 的檔案中。為了配合只有 64KB RAM 的老硬體,這款 AI 放棄了現代 AI 標配的浮點運算,改用 Z80 原生的 16 位元整數運算。
此外,該模型採用了極其罕見的「2 位元權重向量化」技術。這意味著每個權重只能在 {-2, -1, 0, +1} 這四個數值間變動,讓一個位元組就能打包儲存 4 個權重,大幅降低了對儲存空間與記憶體的渴求。
聊天、猜謎兩相宜:雖然慢但「有個性」
目前 Z80-μLM 提供了兩個主要範例:
-
Tinychat 機器人:以極簡風格回應使用者的問候。它不會跟你長篇大論,而是用「OK」(中性確認)、「WHY?」(質疑前提)或「MAYBE」(不確定)等詞彙來互動。
-
Guess 猜謎遊戲:這是一個經典的「二十個問題」遊戲,AI 心中會守著一個秘密,讓使用者透過是非題來破解。
不過,要在老硬體上執行 AI 還是有代價的。根據使用者在實際硬體(如 TRS-80)上的測試,AI 產生一個字元可能需要 1 到 2 秒,一段完整的簡短回覆可能要花上 1 分多鐘,完美詮釋了什麼叫「慢工出細活」。
挑戰極限:不在於聰明,而在於「存在」
HarryR 坦承,這套系統絕不可能通過圖靈測試。但這項計畫的價值在於探索 AI 在極限硬體上的可能性。開發者特地設計了模稜兩可的回覆,迫使人類透過上下文去推斷,或是以「是/否」的問題來探測 AI 的理解程度。
對於那些對 AI 能源消耗與基礎架構門檻感到沮喪的開發者來說,Z80-μLM 無疑提供了一種新的啟發:當大家都往「大」的方向走時,往「小」追求極致優化,同樣能展現驚人的工程創意。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!