AlphaGo 擊敗柯潔,在這場人機大戰中我們重新認識了知識的邊界

人類代表選手柯潔「不負眾望」的在昨天輸了和人工智慧 AlphaGo 的圍棋比賽。雖然這場比賽開始前,大家就已經不看好人類陣營,但似乎更重要的不是誰輸誰贏,而是人類和機器在這場比賽中得到了什麼。

柯潔在先前的賽前發布會時曾表示:「我站在歷史變革的節點,很幸運能見證 AlphaGo 這樣強大的對手,我會盡最大努力下好自己的棋,不會輕易妥協,不會說輸了無所謂、『人機共贏』,而是抱有必勝心態、必死信念,不會輕易言敗。」

外界普遍不看好人類

去年 AlphaGo 李世乭對戰前,許多職業人士都曾預計電腦 (人工智慧) 無法勝出,但是在見識過 AlphaGo 強大的實力後,今年很多職業人士認為,柯潔獲勝機率很微。其實就連柯潔自己也認為,想要取勝「會非常艱難」,但自己「會拼死一搏」。

AlphaGo 擊敗柯潔,在這場人機大戰中我們重新認識了知識的邊界

這一次,烏鎮舉辦的對弈似乎是為了徹底讓人類死心。但對大多數人來說,可能早就已經有對比賽結果的預期。畢竟,AlphaGo 在年初 60 場大戰的不敗戰績,已充分說明。

最終結果果然不意外,在昨天 AlphaGo 和柯潔的第一戰中, AlphaGo 以多 1/4 子的成績擊敗柯潔。

去年 AlphaGo 的崛起,被視為是人工智慧發展史上的一個重要里程碑,因此有許多科技界、圍棋界人士都十分關注此次人機第二次圍棋對決的結果。

AlphaGo 擊敗柯潔,在這場人機大戰中我們重新認識了知識的邊界

學術權威雜誌《自然》(《Nature》) 曾報導稱,由於一場圍棋棋局總排列組合數高達 10 的 171 次方,因此很難以傳統的計算解法,慢慢地試探出最佳策略。但是隨着數學演算法的進步,AlphaGo 團隊建立了「蒙地卡羅樹搜尋」與兩個深度神經網路相結合的運算系統,令 AlphaGo 成為世界上最精湛的深度學習人工智慧系統,大大提高了人工智慧在圍棋上的表現。

此次人機大戰柯潔與 AlphaGo 的勝負,無疑是最大的看點。去年李世乭與 AlphaGo 的比賽,雖然李世乭最終以 1:4 落敗,但那唯一的一勝意義重大。圍棋畢竟還是太複雜,太漫長,人工智慧雖然綜合實力強於人類高手,但在某些瞬間,人類智慧的閃光還是令人驚豔。也許對於人類陣營來說,這象徵著一場光榮的小勝利,但對於 AlphaGo 的 DeepMind 團隊來說,AlphaGo 只要輸了任何一盤,都代表它還有進步空間,這對於科學家們研究人工智慧的未來道路上,未嘗不是件好事。

AlphaGo 再進化

也因為和李世乭這一場敗局,令 DeepMind 團隊將 AlphaGo 的程式再進化,如果說李世乭當時對上的是 AlphaGo 1.0,那麼這一次柯潔將面對的是 AlphaGo 2.0。 

柯潔在賽後表示,「AlphaGo 和之前已經判若兩人,幾乎成為我理解中的『圍棋上帝』。我之前一直在尋找 AlphaGo 的缺陷,然而現在我只能嘗試尋找其 bug。」

外界評論,本次 AlphaGo 和柯潔對奕中,AlphaGo 的棋風已完全脫離人類經驗。AlphaGo 1.0 是巧妙地混合了三種算法:「蒙特卡洛樹搜索」+「監督學習」+「增強學習」。

根據公開資料推測,此次 AlphaGo2.0 的技術原理與之前有著巨大不同:

  • 放棄了監督學習:沒有再用人的 3,000 萬局棋譜進行訓練這本是 AlphaGo 最亮眼的算法,也是今天主流機器學習不可避免的核心條件,依賴於優質的數據,在這個特定問題下就這麼被再次突破了。
  • 放棄了蒙特卡洛樹搜索,不再進行暴力計算:理論上,算法越笨,就越需要暴力計算做補充。算法越聰明,就可以大大減少暴力計算。從 AlphaGo 2.0 的走棋非常迅速來看,約在每10秒鐘就走棋一步,如此速度很可能是放棄了暴力的計算。
  • 極大化增強學習的作用,之前敲邊鼓的算法,正式成為主力。兩台機器遵守走棋和獲勝規則,從隨機走棋開始日夜切磋,總結經驗,不斷批評和自我批評,一周後終成大器。

在這樣的算法下,AlphaGo 2.0 對計算資源開銷極小,把當前棋局輸入神經網路,電流流過,輸出就是最佳的走棋方案。

輸定了,那比賽還有什麼好看?

2017 人機大戰的意義在於重演一部進化史,重新認識智慧的邊界。

在以往的圍棋比賽過程中,總有一些「套路」是不會被打破,這些套路曾被奉為人類經驗知識的聖殿,是不可變更的,但 AlphaGo 正是透過突破這些規矩,達到新的高峰,這對人類本身來說也是一種啟發。

AlphaGo 在圍棋方面已經做得很好,是 DeepMind 的人工智慧科學家和世界各國的圍棋頂尖選手共同探索的結果。在這個過程中,其實並不是人類與人工智慧對戰,而是科學家和圍棋選手共同探索。

科學家探索的是人工智慧,圍棋選手探索的是圍棋藝術。AlphaGo 每一次升級,都意味著 DeepMind 的人工智慧團隊對「如何在有限資訊下做出更好選擇」這問題有更深刻的認識,這問題正是讓人工智慧理解人類、產生思維的關鍵。

AlphaGo 擊敗柯潔,在這場人機大戰中我們重新認識了知識的邊界

▲AlphaGo 的幕後研究團隊。

除此之外,DeepMind 團隊在 AlphaGo 今年年初以「Master」代號在網路上大殺四方後曾表示,開發 AlphaGo 的目的一直都不是為了和人類下圍棋,而是希望將其研發成果用於其他有助於人類的領域。未來將在開源部分程式後終止圍棋項目的開發。因此,本次比賽或許將成為 AlphaGo 與職業圍棋高手的最後一次正式比賽。

但這場比賽以及去年和李世乭這兩場世紀對戰,再加上年初「Master 60 連勝紀錄」或許已經足夠讓 AlphaGo 的製作團隊可以進一步的加強人工智慧的設計,畢竟圍棋這種東西,本來就是人類智慧的結晶,選手下的每一手棋都將會影響後續的布局,因此,選手通常會需要預判對手可能的心理,並且提早想好接下來的路數,才能不讓自己走進死胡同,或是掉進對方的陷阱被敵人牽著走。

也就正因為 AlphaGo 是和世界頂尖的圍棋好手對決,它才能夠快速地累積經驗,儘管昨天這場比賽人類終究輸了 (大家都知道的結果),但柯潔雖敗猶榮,因為此役還是幫助 AlphaGo 變成更棒的人工智慧,未來能夠幫助人類進行其他有意義的工程。

人工智慧成為地球的主人

科學家史蒂芬·霍金則公開警告說,人工智慧的發展可能意味著人類的滅亡:「我們已經擁有原始形式的人工智慧,而且已經證明非常有用。但我認為人工智慧的完全發展會導致人類的終結」,因為「一旦經過人類的開發,人工智能將會自行發展,以加速度重新設計自己」,同時,「由於受到緩慢的演化的限制,人類不能與之競爭,最終將會被代替。」

AlphaGo 擊敗柯潔,在這場人機大戰中我們重新認識了知識的邊界

這其實也就是為什麼科技界、商業界的領軍人物頻頻發出人工智慧威脅論的原因,原因很簡單,人類是有限的。人類不僅信息、資源、理性與智力均有限,人類的道德更是有限。人類的進步有限,人類控制人工智能的能力也將有限,而人工智能的發展卻沒有極限。所以,有一天人工智能或許會比我們「智人」更瘋狂!

AlphaGo 擊敗柯潔,在這場人機大戰中我們重新認識了知識的邊界

▲柯潔和 Google CEO Sunder Pichai 解釋 AlphaGo 的棋風。

除此之外,跟人類比起來,人工智慧的能量幾乎是無窮的。所以,若比體力與智力,人工智慧完勝人類。由此不難預測,凡是拼力氣的活,以及需要拼力氣的智力活 (如大數據分析),人類以後就不要去和機器人拼了,因為完全不具備經濟上的比較優勢。

AlphaGo 擊敗柯潔,在這場人機大戰中我們重新認識了知識的邊界

可以想像,被人工智慧取代的工作甚至職業一定會越來越多。根據一項報告稱,到了 2025 年,約有 25% 的工作將由人工智慧或是機器人所取代。然而,人類獨有的創造性,互動性和談判性能力,在職業競爭中仍然佔有絕對優勢。相比人類,人工智慧目前欠缺的是原創能力、互動能力和談判能力。

未來一定是黑暗的?

未必。「人類 + 人工智慧」的決策模式將成為主流。作出一個商業決策需要四個要素:知識、經驗、決策以及應變能力。一個優秀的商業決策者,必須要有強大的知識背景、經驗累積、數據分析能力、全局判斷能力以及靈活應變的能力。

然而,這一切人工智慧也都可以做到。

AlphaGo 當時之所以能打敗李世乭,是因為它學習了 3,000 萬步人類圍棋大師的走法,累積了 3,000 萬局勝負經驗,在自我對弈的訓練中形成了能對局面評估的大局觀。這些能力不僅能讓AlphaGo作出決策,還能不斷修正決策。

人工智慧擅長精確運算和邏輯推理,而人類則擅長情感和創造、領導和組織,可以說各有所長。那麼「人類+人工智慧」,借助於大數據、模仿以及深度學習等手段,完全可以在管理思維和商業決策上邁上新台階。

AlphaGo 擊敗柯潔,在這場人機大戰中我們重新認識了知識的邊界

未來,普通管理者的角色勢必將會漸漸由人工智慧來完成,但卓越的創造性分析,決策工作,也就是領導者的工作,仍將由人類來主導。而未來的競爭,肯定不僅是人和人之間的競爭,也將是人和人工智慧之間的競爭,背後則是資本與技術的較量。

使用 Facebook 留言

發表回應

謹慎發言,尊重彼此。按此展開留言規則