FB 建議貼文

選取貼文複製成功(包含文章連結)!

OpenAI 模型拿下 IMO 金牌,團隊成員表示 AI 面對難題這次終於認輸說「我不會」正是擺脫幻覺的開始

OpenAI 模型拿下 IMO 金牌,團隊成員表示 AI 面對難題這次終於認輸說「我不會」正是擺脫幻覺的開始

在 AI 成功奪下國際數學奧林匹亞(IMO)金牌後,OpenAI 的三位核心成員 Alex Wei、Sheryl Hsu 與 Noam Brown 受邀參與紅杉資本舉辦的對談活動,首度揭露這套模型如何突破解題極限,也聊到了「AI 什麼都答」的幻覺問題如何被破解。

OpenAI 模型拿下 IMO 金牌,團隊成員表示 AI 面對難題這次終於認輸說「我不會」正是擺脫幻覺的開始

不少網友總結這次對談的重點:「這代 AI 不再亂掰答案,而是學會坦承『我不會』,這是一種更可靠的轉變,也可能是模型開始展現『自我意識』的開端。」

面對 IMO 難題,AI 終於選擇說「不知道」

在過去,大型語言模型常因不懂裝懂而產生所謂的「幻覺回答」──看似合理但實則錯誤。這讓使用者(尤其是數學家與電腦科學家)得花上大量時間驗證結果。

而這次的 IMO 第六題難度極高,甚至讓所有模型都「全軍覆沒」。即便投入大量算力演算,OpenAI 模型最後只給出一句:「我無法回答。」雖然讓人略感失望,但研究員 Alex Wei 表示:「模型能避免亂掰錯誤答案,這反而是一件好事。」

另一位研究員 Noam Brown 則補充:「模型不懂,就會承認不懂,這是一種能力。」

他們認為,這種拒絕幻覺輸出的行為,象徵模型開始具備某種程度的「自我認知」,不再盲目迎合提問者,而是能正確評估自己知識邊界。

金牌背後不是奇蹟,而是兩個月的衝刺

有趣的是,Alex Wei 在 2024 年初才剛加入 OpenAI,一週後就被問:「我們什麼時候能拿到 IMO 金牌?」他當時保守預估「2025 應該不太可能」。

結果沒想到短短兩個月,這個三人團隊就成功挑戰世界級數學題目,拿下金牌。Noam Brown 分享,OpenAI 讓研究人員擁有極大自主權,「讓我們能專注開發真正具影響力的技術」。

Alex 也強調,他們優先關注的是「通用解題技術」,而非為比賽特化設計的系統。

 

 

cnBeta
作者

cnBeta.COM(被網友簡稱為CB、cβ),官方自我定位「中文業界資訊站」,是一個提供IT相關新聞資訊、技術文章和評論的中文網站。其主要特色為遊客的匿名評論及線上互動,形成獨特的社群文化。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則