「AI世界」還缺了什麼？牛津大學教授說：體驗現實世界

無限猴子定理認為，讓一隻猴子在打字機上隨機地按鍵，當按鍵時間達到無窮時，幾乎必然能夠打出任何給定的文字，比如莎士比亞的全套著作。

在這個定理中，「幾乎必然」是一個有特定含義的數學術語，「猴子」也不是指一隻真正意義上的猴子，而是被用來比喻成一台可以產生無限隨機字母序列的抽象設備。

這個理論說明，把一個很大但有限的數看成無限的推論是錯誤的，即使可觀測宇宙中充滿了一直不停打字的猴子，它們能夠打出一部《哈姆雷特》的概率仍然少於 1/10^{^183800}。

而且，即使給無數隻猴子無限的時間，它們也不會懂得如何欣賞吟遊詩人詩意的措辭。

「人工智慧（AI）也是如此，」牛津大學電腦科學教授 Michael Wooldridge 這樣說道。

在 Wooldridge 看來，雖然 GPT-3 等 AI 模型借助數百億或數千億的參數展現出了令人驚訝的能力，但它們的問題不在於處理能力的大小，而在於缺乏來自現實世界的經驗。

例如，一個語言模型可能會很好地學習「雨是濕的」，當被問及雨是濕的還是乾的時，它很可能會回答雨是濕的，但與人類不同的是，這個語言模型從未真正體驗過「潮濕」這種感覺，對它們來說，「濕」只不過是一個符號，只是經常與「雨」等詞結合使用。

然而，Wooldridge 也強調，缺乏現實物理世界知識並不能說明 AI 模型無用，也不會阻止某一 AI 模型成為某一領域的經驗專家，但在諸如理解等問題上，如果認為 AI 模型具備與人類相同能力的可能性，確實令人懷疑。

相關研究論文以「What Is Missing from Contemporary AI? The World」為題，已發表在《智慧計算》（Intelligent Computing）雜誌上。

在當前的 AI 創新浪潮中，資料和算力已經成為 AI 系統成功的基礎：AI 模型的能力直接與其規模、用於訓練它們的資源以及訓練資料的規模成正比。

對於這一現象，DeepMind 研究科學家 Richard S. Sutton 此前就曾表示，AI 的「慘痛教訓」是，它的進步主要是使用越來越大的資料集和越來越多的運算資源。

在談及 AI 行業的整體發展時，Wooldridge 給出了肯定。「在過去 15 年裡，AI 行業的發展速度，特別是機器學習（ML）領域的發展速度，一再讓我感到意外：我們不得不不斷調整我們的預期，以確定什麼是可能的，以及什麼時候可能實現。」

但是，Wooldridge 卻也指出了當前 AI 行業存在的問題，「儘管他們的成就值得稱讚，但我認為當前大多數大型 ML 模型受到一個關鍵因素的限制：AI 模型沒有真正體驗過現實世界。

在 Wooldridge 看來，大多數 ML 模型都是在電子遊戲等虛擬世界中構建的，它們可以在巨量資料集上進行訓練，一旦涉及到真實世界的應用，它們就會丟失重要資訊，它們只是脫離實體的 AI 系統。

以支持自動駕駛汽車的人工智慧為例。讓自動駕駛汽車在道路上自行學習是不太現實的，出於這個和其他原因，研究人員們往往選擇在虛擬世界中構建他們的模型。

「但它們根本沒有能力在所有最重要的環境（即我們的世界）中運行，」Wooldridge 說道。

另一方面，語言 AI 模型也會受到同樣的限制。可以說，它們已經從荒唐可怕的預測文本演變為Google的 LAMDA。今年早些時候，一個前谷歌工程師聲稱人工智慧程式 LAMDA 是有知覺的，一度成為了頭條新聞。

「無論這個工程師的結論的有效性如何，很明顯 LAMDA 的對話能力給他留下了深刻的印象——這是有充分理由的，」 Wooldridge 說，但他並不認為 LAMDA 是有知覺的，AI 也沒有接近這樣的里程碑。

「這些基礎模型展示了自然語言產生方面前所未有的能力，可以產生比較自然的文本片段，似乎也獲得了一些常識性推理能力，這是過去 60 年中 AI 研究的重大事件之一。」

這些 AI 模型需要巨量參數的輸入，並透過訓練來理解它們。例如，GPT-3 使用網際網路上千億等級的英語文本進行訓練。大量的訓練資料與強大的運算能力相結合，使得這些 AI 模型表現得類似於人類的大腦，可以越過狹窄的任務，開始辨識模式，並建立起與主要任務似乎無關的聯繫。

但是，Wooldridge 卻表示，基礎模型是一個賭注，「基於巨量資料的訓練使得它們在一系列領域具備有用的能力，也進而可以專門用於特定的應用。」

「符號人工智慧（symbolic AI）是基於『智慧主要是知識問題』的假設，而基礎模型是基於『智慧主要是資料問題』的假設，在大模型中輸入足夠的訓練資料，就被認為有希望提高模型的能力。」

Wooldridge 認為，為了產生更智慧的 AI，這種「可能即正確」（might is right）的方法將 AI 模型的規模不斷擴大，但忽略了真正推進 AI 所需的現實物理世界知識。

「公平地說，有一些跡象表明這種情況正在改變，」 Wooldridge說。今年 5 月，DeepMind 宣布了基於大型語言集和機器人資料的基礎模型 Gato，該模型可以在簡單的真實環境中運行。

「很高興看到基礎模型邁出了進入物理世界的第一步，但只是一小步：要讓 AI 在我們的世界中工作，需要克服的挑戰至少和讓 AI 在模擬環境中工作所面臨的挑戰一樣大，甚至可能更大。」

在論文的最後，Wooldridge 這樣寫道：「我們並不是在尋找 AI 道路的盡頭，但我們可能已經走到了道路起點的盡頭。」

資料來源：