Google發佈了其迄今為止最強大的人工智慧模型套件"雙子座"（Gemini），但該公司已被指責在性能方面撒謊。

彭博社的一篇專欄文章稱，Google在最近的一段影片中誇大了"雙子座"的性能。專欄作家帕米-奧爾森（Parmy Olson）說，Google在本週早些時候的發佈會上播放了一段令人印象深刻的"What the AI quack"的上手影片，在影片中，Gemini 看起來能力非凡--也許能力太強了。

這段六分鐘的影片展示了 Gemini 的多模態功能（例如，口語對話提示與圖像識別相結合）。雙子座似乎能快速識別圖像（甚至是連線圖片），在幾秒鐘內做出反應，並即時跟蹤杯球遊戲中的紙團。當然，人類可以做到所有這些，但這是一個能夠識別並預測接下來會發生什麼的人工智慧。

不過，點選 YouTube 上的影片描述，Google有一個重要的免責聲明：「為了展示的目的，影片經過縮時處理，雙子座的輸出時間已經縮短，以求簡潔」。

這正是奧爾森不滿意的地方。根據她在彭博社發表的文章，Google在被要求發表評論時承認，影片展示並不是通過語音提示即時進行的，而是使用了原始鏡頭中的靜止圖像幀，然後寫出文字提示，讓雙子座做出回應。

奧爾森寫道：「這與Google似乎在暗示的內容大相逕庭：人可以與雙子座進行流暢的語音對話，同時雙子座會即時觀察並回應周圍的世界。」

「公平地說，Google經常對他們的展示影片進行剪輯，尤其是許多公司希望避免現場展示帶來的任何技術故障。稍作調整是常有的事。但是，Google在影片展示方面一直都有這類的問題。人們也曾質疑過Google的 Duplex 展示結果（還記得 Duplex 嗎？Duplex 是一款人工智慧語音助手，可以打電話給髮廊和餐館預訂房間。）而預先錄製的人工智慧模型展示影片，往往會讓人更加懷疑。」

在這種情況下，奧爾森認為Google是在作秀，目的是誤導人們，讓他們不知道 Gemini 仍然落後於 OpenAI 的 GPT。

Google對此並不認同。當被問及展示的真實性時，Google指出了Google DeepMind 研究副總裁兼深度學習負責人 Oriol Vinyals（也是 Gemini 的聯合負責人）的一篇文章，其中解釋了團隊是如何製作影片的。

Vinyals 說：「影片中的所有使用者提示和輸出都是真實的，為了簡潔起見進行了縮時。影片展示了使用 Gemini 建構的多模態使用者體驗。我們製作它是為了激勵開發人員。」

他補充說，團隊給雙子座提供了圖片和文字，並要求它預測接下來會發生什麼。

奧爾森表示，從他們的回答來看，這當然是處理這種情況的一種方法，但對Google來說可能並不是合適的作法。

至少在公眾看來，Google已經被 OpenAI 今年的巨大成功嚇了一跳。如果Google想激勵開發者，就不能通過精心剪輯的宣傳片，這些宣傳片可能會歪曲人工智慧的能力。而是通過讓記者和開發人員實際體驗產品，讓人們在小型公開測試版中用雙子座做蠢事。讓我們看看它到底有多強大。

延伸閱讀：Gemini是Google迄今為止最強大的AI模型，宣稱比ChatGPT好得多
延伸閱讀：Google Bard導入新的Gemini模型：非文字互動功力將大增、真要超車 OpenAI ChatGPT ？
延伸閱讀：Google最強AI模型Gemini 1.0版發佈，支援在PC或手機獨立運作、性能甚至超越GPT-4