人工智慧的發展又跨越了一道巨大的里程碑。近日,比利時布魯塞爾自由大學(VUB)資料分析實驗室發布了一項重磅研究成果,證實商用的大型語言模型已經具備獨立生成原創數學證明的能力 。這次立下大功的是 OpenAI 旗下的 ChatGPT-5.2 (Thinking) 模型,它成功破解了一項過去懸而未決的數學猜想,同時催生出被稱為「vibe-proving」的全新 AI 推理方法 。相關的預印本論文已經在 2026 年 2 月 21 日正式發表於 arXiv 平台 。
歷經七輪對話,AI 扛下核心探索任務
這次研究團隊聚焦的核心命題,是由數學家 Ran 與 Teng 在 2024 年提出的一項數學猜想 。在嚴謹的數學領域中,所謂的「猜想」是指那些基於規律與重複驗證被認為是成立的,但卻還沒有經過嚴謹形式化證明的命題 。換句話說,只有完成完整且有效的邏輯論證,這個猜想才能正式升格為無懈可擊的「定理」 。
研究團隊指出,整個證明的過程總共經歷了七輪與 ChatGPT 的對話互動,最終形成了四個逐步疊代完善的論證版本 。在這個充滿挑戰的過程中,ChatGPT 扛下了最困難的證明路徑探索與核心結構搭建工作,展現出驚人的邏輯梳理能力;而人類研究人員則是退居幕後,全程把控推理的正確性與邏輯的完整性 。
「Vibe-proving」新模式誕生,打破 AI 無創造力迷思
研究團隊將這種由大型語言模型輔助梳理、探索複雜理論構想的新模式,正式命名為「vibe-proving」 。他們認為,這個方法非常有希望複製過去「AI 輔助寫程式(vibe-coding)」的快速發展路徑,讓 AI 在數學領域從基礎的運算工具,快速進化到近乎自動化的理論探索層次 。
布魯塞爾自由大學教授 Vincent Ginis 對此表示:「過去很多人都有一種迷思,認為 AI 系統的創造力本質上只能侷限於對訓練資料的重新組合與拼湊,但這次的研究恰好徹底打破了這個誤解。」 參與這項研究的博士後研究員 Brecht Verbeken 也坦言,雖然團隊早就預判 ChatGPT 能夠幫助數學難題的證明,但它實際表現出來的超高效率,依然遠遠超出了大家的預期 。
人類驗證不可或缺,AI 能力邊界再次擴張
儘管 AI 在這次的證明過程中扮演了不可或缺的核心角色,但研究團隊還是反覆強調,人類的參與以及最終的驗證工作仍然是無可取代的 。特別是在補全證明邏輯的缺口,以及完成最終嚴謹校驗的環節,人類專家的直覺與嚴謹度依然是守住科學底線的關鍵 。
另一位教授 Andres Algaba 則點出未來的發展趨勢,他認為 AI 將會大幅加快數學猜想候選證明的生成速度,這意味著未來數學界的核心瓶頸,將會從「想出證明」轉移到「人類驗證」的環節 。不過他也樂觀地表示,未來語言模型同樣有機會在這個驗證領域提供強大的助力 。
從文字創作到原創推理的典範轉移
這項驚人的成果標誌著,大型語言模型的能力邊界已經從我們熟悉的輔助寫程式、文字創作,正式跨足到需要極度深奧、原創推理的理論數學研究領域 。過去,許多科學家認為 AI 在面對需要嚴格邏輯推導的數學領域時總是顯得力不從心。然而,隨著具備深度思考能力的新一代模型問世,AI 已經證明自己能真正與頂尖學者並肩作戰。未來,我們或許會看到更多塵封多年的數學難題,在 AI 的強大算力與邏輯推演下迎刃而解。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!