
在 AI 成功奪下國際數學奧林匹亞(IMO)金牌後,OpenAI 的三位核心成員 Alex Wei、Sheryl Hsu 與 Noam Brown 受邀參與紅杉資本舉辦的對談活動,首度揭露這套模型如何突破解題極限,也聊到了「AI 什麼都答」的幻覺問題如何被破解。
不少網友總結這次對談的重點:「這代 AI 不再亂掰答案,而是學會坦承『我不會』,這是一種更可靠的轉變,也可能是模型開始展現『自我意識』的開端。」
面對 IMO 難題,AI 終於選擇說「不知道」
在過去,大型語言模型常因不懂裝懂而產生所謂的「幻覺回答」──看似合理但實則錯誤。這讓使用者(尤其是數學家與電腦科學家)得花上大量時間驗證結果。
而這次的 IMO 第六題難度極高,甚至讓所有模型都「全軍覆沒」。即便投入大量算力演算,OpenAI 模型最後只給出一句:「我無法回答。」雖然讓人略感失望,但研究員 Alex Wei 表示:「模型能避免亂掰錯誤答案,這反而是一件好事。」
另一位研究員 Noam Brown 則補充:「模型不懂,就會承認不懂,這是一種能力。」
他們認為,這種拒絕幻覺輸出的行為,象徵模型開始具備某種程度的「自我認知」,不再盲目迎合提問者,而是能正確評估自己知識邊界。
金牌背後不是奇蹟,而是兩個月的衝刺
有趣的是,Alex Wei 在 2024 年初才剛加入 OpenAI,一週後就被問:「我們什麼時候能拿到 IMO 金牌?」他當時保守預估「2025 應該不太可能」。
結果沒想到短短兩個月,這個三人團隊就成功挑戰世界級數學題目,拿下金牌。Noam Brown 分享,OpenAI 讓研究人員擁有極大自主權,「讓我們能專注開發真正具影響力的技術」。
Alex 也強調,他們優先關注的是「通用解題技術」,而非為比賽特化設計的系統。
- 延伸閱讀:你與 ChatGPT 的對話能被 Google 搜到?OpenAI 測試新功能惹議後緊急下架
- 延伸閱讀:OpenAI ChatGPT Agent 輕鬆通過「我不是機器人」驗證測試
- 延伸閱讀:人機大戰!波蘭程式設計師 10 小時馬拉松擊敗 OpenAI AI 模型奪冠
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!