FB 建議貼文

選取貼文複製成功(包含文章連結)!

AI 能寫程式卻難除錯?微軟研究揭示問題關鍵:不懂人類是怎麼 debug 的

AI 能寫程式卻難除錯?微軟研究揭示問題關鍵:不懂人類是怎麼 debug 的

人工智慧成為新世代開發者的重要夥伴已是不爭事實。Google 執行長 Sundar Pichai 就曾表示,如今已有高達 四分之一的新程式碼由 AI 生成,Meta 的 Mark Zuckerberg 也高度關注 AI 在開發領域的應用。然而,儘管 AI 在「寫程式」表現搶眼,但在「找 bug」這件事上,卻明顯力有未逮。

根據微軟研究院最新發表的研究,即便是目前業界最強大的生成式 AI 模型,在面對軟體除錯任務時,表現仍不盡理想。研究團隊測試了包含 Anthropic 的 Claude 3.7 Sonnet 與 OpenAI o3-mini 在內的多款主流 AI 模型,並以 SWE-bench Lite 這套軟體除錯基準集進行 300 項挑戰,結果發現:

  • Claude 3.7 Sonnet 成功率僅為 48.4%

  • OpenAI 模型更低,僅 30.2% 與 22.1%

為什麼 AI 除錯這麼難?關鍵在於「學不到人怎麼做」

研究團隊指出,AI 模型目前最大的瓶頸在於訓練資料本身。現有的語言模型訓練內容多聚焦於程式碼生成與片段補全,但卻缺乏來自真實開發者的除錯紀錄與決策流程

AI 能寫程式卻難除錯?微軟研究揭示問題關鍵:不懂人類是怎麼 debug 的

簡單來說,AI 還無法像人類那樣理解「哪裡出錯、該怎麼判斷、該試哪些工具、怎麼一步步排查」,因為它根本沒看過我們怎麼除錯。

未來若要讓 AI 真正具備除錯能力,就必須蒐集更多「人類除錯歷程」的資料,並進行專門訓練與微調,讓模型學會如何與除錯工具互動、如何思考 bug 形成邏輯。

程式寫得快,但錯也不少?AI 的可靠性仍需觀察

即使現在許多開發者已經習慣使用 Copilot、ChatGPT、CodeWhisperer 等工具輔助寫程式,但許多研究也指出,AI 生成的程式碼中仍潛藏著各種潛在錯誤或安全風險。

例如近期話題工具「Devin」,雖號稱可自主完成軟體專案,但在 20 項基準測試中僅完成了 3 項,顯示其對實際開發場景的理解與應變能力仍遠遠不及人類工程師。

AI 是夥伴不是替代者,開發者仍是不可取代的核心

微軟的研究再次印證,寫程式不只是技術任務,更是一種結合創造力、邏輯推理與經驗判斷的綜合能力。正如比爾・蓋茲所說,「程式設計是一門藝術,而不是機械複製。」

Replit 執行長 Amjad Masad、IBM 執行長 Arvind Krishna 等多位產業領袖也曾表示,AI 是開發者的工具,而不是取代者。未來的工程師不只要懂寫程式,還得學會善用 AI 幫手,讓效率倍增。

AI 還在學走路,開發者要更學會如何駕馭

AI 在編寫程式方面的確展現出驚人潛力,但在除錯、邏輯判斷與系統性問題解決上,仍有不少路要走。開發者該做的不是擔心會被取代,而是學會如何駕馭這位「新手助手」,讓 AI 幫你省力,而不是添亂。

就像給新手司機裝了自動駕駛一樣——直路行得穩,但遇到彎路和突發狀況,還是得靠真正的人來掌握方向盤。

cnBeta
作者

cnBeta.COM(被網友簡稱為CB、cβ),官方自我定位「中文業界資訊站」,是一個提供IT相關新聞資訊、技術文章和評論的中文網站。其主要特色為遊客的匿名評論及線上互動,形成獨特的社群文化。

使用 Facebook 留言
吳同學
1.  吳同學 (發表於 2025年5月07日 17:40)
根據 Microsoft Research 的研究,儘管 AI 在程式碼生成方面取得顯著進展,能夠撰寫 20% 至 30% 的新程式碼,甚至在某些專案中達到 95% 的比例,但在除錯方面仍面臨挑戰。研究顯示,即使配備了除錯工具,AI 模型在解決真實世界的除錯任務時成功率仍低於 50%,例如 Claude 3.7 Sonnet 的成功率為 48.4%,OpenAI 的 o1 為 30.2%。主要原因在於 AI 模型缺乏有效使用除錯工具的能力,以及缺乏模擬人類除錯過程的訓練數據。為此,Microsoft 推出了 debug-gym 環境,旨在透過互動式除錯工具訓練 AI 模型,提升其除錯能力。這項研究強調了人類開發者在軟體開發過程中的不可或缺性,特別是在除錯階段。與此類似,娛樂城推薦dcard 平台在提供高效能與穩定性的遊戲體驗方面表現出色,透過優化平台設計與提升用戶介面,滿足玩家多元化的需求,成為數位娛樂產業中的佼佼者。

https://dupig03.com/

https://x.com/brt70991/bio

https://www.pinterest.com/dupig03/

https://home.gamer.com.tw/profile/index.php?owner=xw79749

https://gravatar.com/joyfullyautomaticb2fc0d25b3

發表回應
謹慎發言,尊重彼此。按此展開留言規則