ChatGPT 首次獨立證明數學猜想！AI 具備原創推理能力，學者驚呼效率遠超預期

人工智慧的發展又跨越了一道巨大的里程碑。近日，比利時布魯塞爾自由大學（VUB）資料分析實驗室發布了一項重磅研究成果，證實商用的大型語言模型已經具備獨立生成原創數學證明的能力。這次立下大功的是 OpenAI 旗下的 ChatGPT-5.2 (Thinking) 模型，它成功破解了一項過去懸而未決的數學猜想，同時催生出被稱為「vibe-proving」的全新 AI 推理方法。相關的預印本論文已經在 2026 年 2 月 21 日正式發表於 arXiv 平台。

歷經七輪對話，AI 扛下核心探索任務

這次研究團隊聚焦的核心命題，是由數學家 Ran 與 Teng 在 2024 年提出的一項數學猜想。在嚴謹的數學領域中，所謂的「猜想」是指那些基於規律與重複驗證被認為是成立的，但卻還沒有經過嚴謹形式化證明的命題。換句話說，只有完成完整且有效的邏輯論證，這個猜想才能正式升格為無懈可擊的「定理」。

研究團隊指出，整個證明的過程總共經歷了七輪與 ChatGPT 的對話互動，最終形成了四個逐步疊代完善的論證版本。在這個充滿挑戰的過程中，ChatGPT 扛下了最困難的證明路徑探索與核心結構搭建工作，展現出驚人的邏輯梳理能力；而人類研究人員則是退居幕後，全程把控推理的正確性與邏輯的完整性。

「Vibe-proving」新模式誕生，打破 AI 無創造力迷思

研究團隊將這種由大型語言模型輔助梳理、探索複雜理論構想的新模式，正式命名為「vibe-proving」。他們認為，這個方法非常有希望複製過去「AI 輔助寫程式（vibe-coding）」的快速發展路徑，讓 AI 在數學領域從基礎的運算工具，快速進化到近乎自動化的理論探索層次。

布魯塞爾自由大學教授 Vincent Ginis 對此表示：「過去很多人都有一種迷思，認為 AI 系統的創造力本質上只能侷限於對訓練資料的重新組合與拼湊，但這次的研究恰好徹底打破了這個誤解。」參與這項研究的博士後研究員 Brecht Verbeken 也坦言，雖然團隊早就預判 ChatGPT 能夠幫助數學難題的證明，但它實際表現出來的超高效率，依然遠遠超出了大家的預期。

人類驗證不可或缺，AI 能力邊界再次擴張

儘管 AI 在這次的證明過程中扮演了不可或缺的核心角色，但研究團隊還是反覆強調，人類的參與以及最終的驗證工作仍然是無可取代的。特別是在補全證明邏輯的缺口，以及完成最終嚴謹校驗的環節，人類專家的直覺與嚴謹度依然是守住科學底線的關鍵。

另一位教授 Andres Algaba 則點出未來的發展趨勢，他認為 AI 將會大幅加快數學猜想候選證明的生成速度，這意味著未來數學界的核心瓶頸，將會從「想出證明」轉移到「人類驗證」的環節。不過他也樂觀地表示，未來語言模型同樣有機會在這個驗證領域提供強大的助力。

從文字創作到原創推理的典範轉移

這項驚人的成果標誌著，大型語言模型的能力邊界已經從我們熟悉的輔助寫程式、文字創作，正式跨足到需要極度深奧、原創推理的理論數學研究領域。過去，許多科學家認為 AI 在面對需要嚴格邏輯推導的數學領域時總是顯得力不從心。然而，隨著具備深度思考能力的新一代模型問世，AI 已經證明自己能真正與頂尖學者並肩作戰。未來，我們或許會看到更多塵封多年的數學難題，在 AI 的強大算力與邏輯推演下迎刃而解。