能自行總結出「貓」這個概念的 Google 自行思考深度學習系統

2012 年 6 月，《紐約時報》曾報導了 Google 如何透過向「DistBelief」提供數百萬份 YouTube 影片來讓該虛擬神經網路系統學習貓的關鍵特徵。這套系統的創新之處在於，它可以在未事先獲取「貓的特徵描述」資訊的情況下自行總結出「貓」這個概念的特徵！

上週五在舊金山舉行的機器學習會議上，Google 軟體工程師 Quoc V. Le 講解了 Google 的「深度學習」系統是如何運作的。

「深度學習」需要用到大型電腦群集來吸收資料（如圖片）對其進行自動分類。Google 的 Android 語音控制搜尋、圖像識別及 Google 翻譯等均採用了這項技術。

2012 年 6 月，《紐約時報》曾報導了 Google 如何透過向「DistBelief」提供數百萬份 YouTube 影片來讓該虛擬神經網路系統學習貓的關鍵特徵。這套系統的創新之處在於，它可以在未事先獲取「貓的特徵描述」資訊的情況下自行總結出「貓」這個概念的特徵！也就是說，DistBelief 具有自學習能力。當然，這套系統的運算能力也非常的龐大，由 1000 台機器組成，共包括 16,000 個核心，處理的參數高達 1,000,000,000 個。

▲圖片來源Jim Wilson/The New York Times

這套系統採用分層機制工作，神經網路的最底層可偵測圖像顏色變化，再上一層則可識別特定類型的輪廓。在增加若干後續分析層之後，系統不同的分支會為臉部、搖椅、電腦等物件生成檢測方法。

不過讓 Quoc V. Le 震驚的是機器學會了辨認連人類都很難分辨的東西—如碎紙機，我們知道那東西是碎紙機是因為我們見過，但是 Google 的這台怪物可沒見過。
Quoc V. Le 解釋說，學習如何歸納出碎紙機特性是件非常複雜的事情，他自己想了很久也沒想出來。

甚至當 Quoc 向自己的許多同事展示碎紙機的照片時他們也在辨認上遇到了麻煩。反而這套系統的識別成功率更高，Quoc 本人都不能確定自己能否寫出程式來做到這一點。Quoc 解釋說，這是因為人需要靠資料而不是自己來歸納特性。

也就是說，這件事情意味著現在 Google 的研究人員已經無法說清楚究竟這套系統是如何識別出特定物件的了，因為程式看起來已經有了獨立思考的能力，其複雜的認知過程是不可預測的，雖然這種「思考」能力仍局限在非常狹隘的範疇。

不過，Google 並不指望深度學習系統會自行發展成為一套成熟的新興人工智慧系統。研究總監今年早些時候曾說過：

AI（人工智慧）會自己產生？我是非常實用主義的—我們得做了才會讓事情發生。

不過 Google 負責 AI 的 Peter Norvig相信，對於可靠語音辨識及理解等棘手問題來說，Google 採用的此類密集統計資料模型是最好的希望，這點與 Noam Chomsky 的觀點不一致。

深度學習對 Google 很有吸引力，因為它能夠解決該公司自己的研究人員無法解決的問題，還能夠讓 Google 少雇一些不稱職的人。我們知道，Google 以招聘人中龍鳳著稱。

放權給機器這件事 Google 以前沒少做過。像 Google 眾多資料中心的資源管理就是由 Brog 及 Omega 負責的。這些群集管理系統能像「生物」一樣分配工作負載。

考慮到 Google 的抱負是「組織全世界的資訊」，當然是雇用的人越少越好。Quoc 說，透過開發這些「深度學習」系統 Google 可以少雇一點人類專家。
他補充道：

機器學習是很困難的，因為哪怕從理論上來說可以運用邏輯回歸等演算法，但實際上我們在資料處理挖掘特性等事情上花費了大量時間。每一個問題都得雇用領域專家。……所以 Google 希望機器能做那些事情。

透過努力工作，賦予機器更大的能力，以及局部的、有限的智慧，Google 可解決人類專家無法解決的分類問題。會不會發展成天網呢？答案是否定的。但它可以發展成專家型機器。幸運的是，機器目前還是合作的。(theregister.co.uk)

延伸閱讀:

微軟創始人Paul Allen 要讓有人工智慧的機器人通過高中生物考試

現階段人工智慧電腦的智力水準可能更接近 4 歲小孩

巨星殞落！人工智慧之父、LISP 語言發明人 John McCarthy 去世

離天網更近？模擬1秒人腦活動要多久，超級電腦說要40分鐘

高通的 Zeroth 計畫：人腦模擬

人工智慧的又一步： Vicarious 模擬人腦成功破解文字驗證碼CAPTCHA