托福、雅思效率慢!英語測試系統「duolingo」用 AI 出題,無須預約、在家能考,成績超過900所大學承認

托福、雅思效率慢!英語測試系統「duolingo」用 AI 出題,無須預約、在家能考,成績超過900所大學承認

要出國留學都需要通過英語能力測試,像是托福、雅思都是,但是這些都需要預約並且到考場去現場考試,而且公布成績也要等一段時間。不過,英語能力測試是否一定要到現場去考呢?有沒有線上測試的選擇呢?多鄰國英語測試(duolingo english test)就是這麼一個線上考試系統,這是多鄰國旗下的英語能力測試系統,也是目前市場上唯一結合了AI技術的英語考試。

多鄰國英語測試的產品負責人Rogelio表示,傳統英語考試的難度是遞增的,這種模式耗時時間很長,考生必須從最低難度做起,經歷完整的難度循環。但是,多鄰國運用了人工智慧和機器學習的最新技術,自動調整配合考生的英語水準,直接將考試時間縮減了4倍,考生的考試時間也直接縮短到了45分鐘內。

而且,多鄰國的英語成績也逐漸得到全球範圍內眾多高校的認可,世界範圍內900餘所大學的招生體系都表示承認多鄰國的英語成績,其中80%為美國院校,包括耶魯大學,哥倫比亞大學,紐約大學,南加州大學,杜克大學等頂級名校等頂級名校。

疫情不止托福取消,多鄰國英語測試 AI 出題2天給成績,全球超過900所大學承認

和托福雅思一樣,考生只需使用電腦就能完成測試,但是,在考試結束後48小時之內就可以收到考試結果,這和托福雅思相比,效率快很多。考生也無需提前幾個月預約考位,只要對攝影鏡頭出示相關身份進行自我身份認證後,在自己狀態好的任意時間段內進行測試。

考試費僅需49美元,和托福雅思相比也便宜許多。在正式考試之前,多鄰國還支持無限次的體驗測試,以適應多鄰國的考試形式。

多鄰國英語測試(duolingo english test)網站

結合AI,線上考試成色如何?

我們都知道,語言考試目的是明確在整個難度階梯上,考生具體處在哪個位置,基於這樣的評價標準,假如考生在低難度的題目表現很好,系統就會將難度提升,準確率下降就減少難度。透過AI調整試題目難度,直到考生準確率保持穩定,而此時的難度對應的就是考生的語言熟練度。

可以用大家都有所瞭解的CEFR(Common European Framework of Reference,歐洲共同參考框架)來說明,CEFR是對英語類語言的語言能力評價標準,按照所學語言分為初級、中級和高級三個等級,通常被標記為A1、A2、B1、B2、C1和C2。

在這個評價體系中,考生的語言水準根據聽、讀、寫、說四個方面進行評估,測試範圍從「能夠理解和產生基本的問候語」(初級水準)到「能夠產生關於複雜主題的結構良好的詳細文本」(高級水準)。

疫情不止托福取消,多鄰國英語測試 AI 出題2天給成績,全球超過900所大學承認

從CEFR的框架和標準出發,多鄰國對一些文本做了相應的調整,比如將對中級學習者等級的文本,修改成為內容相同但是初學者等級的文本,有時也需要將A2的內容調整到A1。

這就需要將語言的詞彙、語法或習慣用語以及與文化相關的方面,調整或簡化為不同層次的學習者更容易理解的形式。而要完成CEFR中多種語言、數十萬單詞的標記,對於課程專家來說,手工標記不僅昂貴而且令人抓狂。

疫情不止托福取消,多鄰國英語測試 AI 出題2天給成績,全球超過900所大學承認

於是,他們訓練了一個機器學習系統,用幾千個手寫的CEFR標籤來標記英語、西班牙語和法語單詞,同時允許該模型被推廣到其他語言中。這個有序回歸學習模型採用一個單詞及其源語言,預測目標學習者的CEFR水準。

該項技術是透過使用轉移學習(transfer learning)和領域適應技術(domain adaptation techniques)完成的,依靠一些與語言無關的特性,就足以將模型推廣到新的語言中。這也意味著,模型的特徵包括了多語言詞嵌入(multi-lingual word embeddings, MWEs)和語料庫頻率(corpus frequencies)。

多語言詞嵌入將單詞映射到一個300維的空間(300-dimensional space),在這個空間中,出現在多個語言語料庫中的類似功能和語義上下文中的單詞將趨向於彼此靠近,提供了一個單詞「意義」的語言不可知表示,如下面描述的簡化的3D空間所示:

疫情不止托福取消,多鄰國英語測試 AI 出題2天給成績,全球超過900所大學承認

 

CEFR對考生的交流能力是,能夠要求根據主題語義信息進行靈活變化,例如,能否可以在涉及問候、個人生活、食物、家庭的日常環境中進行互動。因此MWEs和語料庫頻率需要在直觀上具有良好的動機。

研究者希望對這些能力進行合理安排,使學習者在學習稀有語言之前先熟悉頻繁出現的語言。但是AI的意義體現在哪?為什麼不簡單地將英語中的CEFR單詞表翻譯成其他語言?

比如,我們用英語說「I am hungry」,西班牙語說「tengo hambre」,兩個表達式都在A1等級。然而,如果只是逐字逐句地翻譯,那麼最終會得到西班牙語形容詞hambriento或英語名詞hurgen,這些單詞實際上是B1。

除此之外,語言之間習語表達的不匹配也使得很難直接翻譯單詞表,而建模頻率和語義的方法表現更好。

疫情不止托福取消,多鄰國英語測試 AI 出題2天給成績,全球超過900所大學承認

 

bigdatadigest
作者

大數據文摘(bigdatadigest)成立於2013年7月,專注數據領域資訊、案例、技術,在多家具有影響力的網站、雜誌設有專欄,致力於打造精準數據分析社群。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則