相關文章

41a19da180e455ccb4dc3637d831f20f 當你申請網路會員或是登入網頁時,在輸入個人資料之後,網頁頁面會顯示一組亂數,可能是英文字母,也可能是數字,有時甚至是以難以辨識的字體呈現,而你必須正確輸入那組亂數,才能順利進入網頁。有些人對此不以為意,有些人則感到惱人與不便,但你是否想過,這組亂數背後究竟藏著什麼驚人的秘密?

確保網路安全的亂數

這個亂數機制叫作「CAPTCHA」,由於人類具備辨識扭曲文字的能力,而電腦只能辨識清楚工整的文字,所以它的存在是為了確保網路的使用者是人類而非能夠一次提交數百萬次資料的電腦程式。以美國網路售票系統Ticketmaster為例,使用「CAPTCHA」是為了避免惡意電腦程式一次購買上千張票券,以確保售票系統能順暢運作。

Louis von Ahn是美國卡內基美隆大學電腦科學學院的副教授,更是群眾外包(Crowdsourcing)的先鋒學者,他在2011年的TED演講中幽默地表示,其實網頁的亂數機制正是他十多年前的發明!有鑑於快速成長的網路使用人口,他致力於收集群眾的集體智慧,藉由群眾外包的力量完成許多大型專案。近年來,他著手於「CAPTCHA」的進化-「reCAPTCHA」,而「reCAPTCHA」的技術更在2009年被網路巨擘Google買下。

光學字元識別技術的瓶頸

全球每天有將近兩億筆亂數辨識的發生,每個使用者平均花費十秒在輸入亂數,Louis von Ahn開始思考如何讓這微小的十秒也能產生重要的意義。網路時代來臨,消費者閱讀習慣改變,Google、推出電子書閱讀器Kindle的Amazon,都致力於書籍的數位化。

如何將紙本書籍數位化呢?我們必須將書籍的每一頁掃描成影像,而電腦必須依靠光學字元識別技術(optical character recognition)來辨識影像中的所有文字,然而,年代較為久遠的書籍經常有油墨褪色、頁面泛黃的狀況,造成光學字元識別技術無法順利進行,超過五十年歷史的書籍,往往只有30%的成功識別率。

書籍數位化的突破性發展

Louis von Ahn靈機一動,結合既有的「CAPTCHA」機制,推出同時具有辨識網路安全、幫助書籍數位化功能的「reCAPTCHA」機制:網路使用者會收到兩組文字,其中一組是網路系統已經知道答案的文字,由此確保使用者是人類而非電腦程式,而另外一組則是在書籍數位化過程中無法被辨識的文字,藉此收集使用者的文字辨識智慧。透過網路使用者無形之中的參與,電腦能夠比對眾多的答案,進而辨識出正確的文字。

目前全球包括推特(twitter)和其他將近350000個網站,都使用了「reCAPTCHA」這項巧妙運用群眾外包力量的技術,每年約可幫助兩百五十萬本書籍完成數位化。想像每次你在Ticketmaster購買票券,或是登入網路拍賣商店的會員時,其實你默默促成了一本好書的數位化,或許知道這個真相之後,你再也不會覺得這是一個浪費時間的登入程序了!

群眾外包促進知識流通

Louis von Ahny在2011年所創辦的網路平台Duolingo,成功結合群眾外包概念和全球語言學習的風潮。Duolingo的商業模式為:提供免費線上語言學習課程,會員能夠得到大量翻譯文句的練習機會,充分達到「做中學」的目的;而Duolingo藉助會員漸增的語言能力,同時也將客戶委託協助的內容翻譯完成。

隨著會員語言程度的提升,Duolingo會提供難度更高的文句翻譯練習,會員也可以藉由比對其他人的翻譯結果,增進語言能力。經過調查與測試,Duolingo確實成功提升了會員的語言能力,會員也認為翻譯內容為學習的過程增添了許多趣味,而群眾外包的力量甚至能達到專業翻譯的水準。

最重要的是,有別於一般語言課程的高收費模式,Duolingo提供了公平的語言學習管道,無論是富有或是貧窮的人都能透過Duolingo得到免費學習的機會,並在學習中創造共同價值,「群眾外包」促成文字能以不同語言散播至全球各地,成功消弭知識傳播的隔閡。

參與就是力量

「reCAPTCHA」和Duolingo都是群眾參與知識傳遞與保留的最佳實例,在現今網路普及的時代,我們更容易參與公眾事務,也更容易發揮自己所長、為社會帶來影響力,從「群眾外包」到「群眾募資」,「參與」將成為改變世界最重要的力量!

撰稿:Sophina Chou

本文獲TEDxTaipei授權轉載,原文連結在此


在2009年TED開放授權後,TEDxTaipei也隨之成立。一群充滿熱情的夥伴,透過TEDxTaipei平台,以改變世界為目的,呼籲群眾參與世界,創新學習、讓智慧轉化行動,好點子遍地開花。TEDxTaipei每年將會舉辦一次大型年會,及數次中、小型活動,已累積上百支影片,包含作家蔣勳、舞蹈家許芳宜、宏碁集團創辦人施振榮.....等,這些影片可於TEDxTaipei官網上瀏覽。
TEDxTaipei官網粉絲團

使用 Facebook 留言

肥貓
2.  肥貓 (發表於 2014年8月28日 21:29)
有些英文字與數字扭曲到無法辨識
根本看不清楚
感覺有點走火入魔了
Hiro
4.  Hiro (發表於 2014年8月30日 16:00)
原來有時會看到一張舊舊的文字圖片的是 reCAPTCHA 這樣的機制。
長見識了。

發表回應

謹慎發言,尊重彼此。按此展開留言規則