FB 建議貼文

選取貼文複製成功(包含文章連結)!

香港科技大學教授實測AI眼鏡「作弊」:30分鐘輕鬆擊敗95%學生,揭示傳統教學評估困境

香港科技大學教授實測AI眼鏡「作弊」:30分鐘輕鬆擊敗95%學生,揭示傳統教學評估困境

香港科技大學的張軍教授與孟子立教授團隊,最近做了一項相當大膽的實驗。他們讓一副搭載了 ChatGPT-5.2 模型的 AI 眼鏡進入大學期末考場,結果這位非人類考生只花了 30 分鐘就拿下 92.5 的高分,成績狠狠甩開 95% 的人類學生。這場實測不僅證明了現在 AI 硬體結合大型語言模型的實力,更直接衝擊了我們習以為常的教學評估制度。

AI 眼鏡化身作弊神器,橫掃大學期末考

真的太誇張了,AI 這次是以作弊者的身分闖進大學考場。這件事發生在香港科技大學的大學部課程電腦網路原理的期末考現場。一副搭載 ChatGPT-5.2 模型的 AI 眼鏡,在模擬真實考試的情境下,完成了整份試卷。

結果讓人跌破眼鏡:這副眼鏡只用了 30 分鐘就交卷,還考了 92.5 分。在一百多人的成績排名中,它直接殺進前五名,輕鬆擊敗現場超過 95% 的人類考生。以前作弊靠小抄,現在作弊直接戴上一整台電腦。不過,當 AI 已經能完美執行考試流程時,大家擔心的恐怕不只是學生會不會拿來作弊,而是我們的考試制度是不是該檢討了。

軟硬體大比拚,Rokid 眼鏡脫穎而出

這場人機大戰其實是教授團隊精心設計的實驗。他們的目標很明確:讓 AI 眼鏡光明正大作弊,看看能考幾分。測試科目選的是讓很多資工系學生頭痛的電腦網路原理,這門課充滿了專業概念、邏輯推導和演算法。

為了讓 AI 考生發揮實力,團隊在硬體挑選上可是費了一番苦心。他們評估了市面上 12 款主流智慧眼鏡,包括 Meta、小米和 Rokid 等品牌。第一輪篩選後,發現同時具備內建鏡頭和整合顯示螢幕的產品並不多,最後剩下 Meta Ray-Ban、Frame 和 Rokid 進入決選。

雖然 Meta 的眼鏡很紅,但因為沒有開放顯示內容的控制介面,沒辦法滿足實驗需求。相比之下,Rokid 的開發工具比較完善,自由度更高。加上考量到相機畫質對試卷辨識的影響,團隊最終選定 Rokid AI 眼鏡作為硬體選手。至於大腦部分,團隊鎖定了 OpenAI 的 ChatGPT-5.2 模型(註:原文如此,可能指特定微調版本或型號),看中它的反應速度和通用知識能力。

作弊流程超順暢,但也有罩門

考試過程非常流暢:學生低頭看考卷,眼鏡上的鏡頭快速拍攝題目,透過 Wi-Fi 傳到雲端的大型語言模型進行推論,生成的答案再傳回眼鏡螢幕,學生只要照抄就好。

結果顯示,這款 Rokid 眼鏡在選擇題和簡答題都拿了滿分,就算是那種很難的跨頁簡答題,它也能靠著強大的上下文邏輯推論拿到大部分的分數。即便運算最複雜的部分偶爾會出錯,但中間的推導步驟寫得有模有樣。

不過,這場測試也暴露出目前商用 AI 眼鏡的短板,那就是耗電和發熱。在開啟 Wi-Fi 和持續傳輸高解析度影像的情況下,才考了 30 分鐘,電量就從 100% 掉到 58%。這表示 AI 眼鏡想要全天候使用,電池技術還有很大的進步空間。另外,鏡頭的清晰度也是關鍵,如果題目反光或角度不對,AI 就會瞎掉,導致答題準確率下降。

傳統考試只測結果,AI 卻贏在結果

這場實驗給教育界的一記重拳在於:當我們還在用標準答案來評估學生時,這恰好是 AI 最擅長的領域。從小到大的考試,多半是在測驗記憶力和標準解題步驟。以前這招管用,是因為人腦在記憶和運算上有個別差異。但現在 AI 比你記得牢、算得快,還不會緊張手抖。

像之前也有人改裝 Meta 智慧眼鏡在西洋棋比賽中作弊,AI 總是能給出最佳解法。英國雷丁大學的研究也發現,AI 生成的考卷混入題庫後,有 94% 成功騙過老師,分數還比真人高。

這下尷尬了,比背書、比解題SOP,人類根本贏不了 AI。這逼得我們必須重新思考:考試到底在測什麼?

教育改革:從交答案變成交思路

真正的學習能力,像是提出好問題、在資訊不足時做判斷、權衡不同方案,以及同理心,這些才是人類的強項,也是傳統筆試很難測出來的。未來的評估方式,必須從看結果轉向看過程。

教育心理學家早就說過,人類的智慧是多元的。但在標準化考試下,只有邏輯數學和語言能力被放大檢視。現在既然 AI 能搞定標準化測試,我們就該去測那些 AI 做不到的事。

國外已經有學校開始改變。像是紐約大學商學院就引入 AI 輔助口試,學生不只要交作業,還得當場跟 AI 考官解釋你的決策邏輯。重點不再是你寫了什麼答案,而是你為什麼這樣想。

 

 

 

科客網
作者

一個富有活力的科技資訊網站。設置資訊、酷玩、視頻、評測等頻道,網羅全球最新鮮的科技資訊,探討科技的現在與未來。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則