為什麼Amazon的智慧音箱能夠領先搜尋引擎起家的 Google ? 語音時代,搜尋只需要唯一答案

為什麼Amazon的智慧音箱能夠領先搜尋引擎起家的 Google ? 語音時代,搜尋只需要唯一答案

Amazon Echo在全球帶起智慧音箱熱潮以來,Google、阿里巴巴、小米、百度、蘋果、LINE......東西方科技公司都已陸續跟進這波浪潮。但是,我們都知道,全球最大的搜尋引擎是Google,為什麼同樣是提供搜尋、得到答案的智慧音箱,反而是非搜尋引擎起家的Amazon出頭呢?很多人都說Amazon Echo的智慧音箱就是比較好,但是,到底好在哪裡?

智慧語音助理時代,透過智慧喇叭之類的裝置,人們開始透過語音進行搜尋。而這樣的趨勢,給尋找問題的答案帶來了變遷。與之前提供多個鏈接的結果相比,透過語音搜尋的用戶,只需要一個答案。提供這些服務的公司,該怎麼應對這一變遷呢?

近日,《連線》雜誌上發表了一篇文章,介紹了尋找「一次性」(one-shot)答案的歷程。文章改編自自由撰稿人詹姆斯‧弗拉霍斯(James Vlahos)將於3月出版的一本新書《How Voice Computing Will Transform the Way We Live, Work, and Think》。文章原題為「Amazon Alexa and the Search for the One Perfect Answer」。

為什麼Amazon的智慧音箱能夠領先搜尋引擎起家的 Google ? 語音時代,搜尋只需要唯一答案

一、

如果你在20世紀90年代末參觀過劍橋大學的圖書館,你可能會看到一個瘦瘦的年輕人,他的臉被筆電螢幕的光芒照亮。

在這幾年前,威廉‧滕斯托爾-佩多(William Tunstall-Pedoe)就已經結束了他的電腦研究課題,但他仍然津津有味地品味著陳舊紙張散發出的霉味,喜歡那種書籍從四面八方湧入的感覺。

圖書館收集了幾乎所有在英國出版的書籍的複印件,龐大的訊息量——500萬冊書籍和120萬種期刊——激勵了他。

當然,大約就在這個時候,另一個巨大的知識寶庫——Internet——正在形成。 Google 憑藉其著名的使命宣言「組織全世界的訊息,使其普遍可閱讀並且有用」,正自豪地步入其作為「圖書管理員」的角色。

不過,儘管滕斯托爾-佩多仍舊喜歡在圖書館裡徘徊,但他認為電腦不應該像圖書館那樣,要求人們費力地追蹤訊息。

是的,瀏覽結果,偶然發現新的資源,發現相關的事實是一件非常愉快的事情。 但大多數用戶真正想要的是一個準確的答案,而不是狩獵般的刺激。

作為實現這一目標的工具,搜尋引擎幾乎和它們那些塞滿書的前輩們一樣笨重。

首先,你必須想出正確的關鍵詞。從 Google 或雅虎提供的長長的鏈接列表中,你不得不猜測哪一個是最好的。

然後你必須點擊它,進入一個網頁,並希望它裡面有你想要的訊息。

滕斯托爾-佩多認為,這項技術的工作方式應該更像《星際迷航》中飛船上的電腦:用日常語言提出一個問題,得到一個「即時、完美的答案」。

他認為,搜尋引擎最終必將讓位於人工智慧。

滕斯托爾-佩多從13歲起,就以程式員的身份賺錢,並且一直對教機器學習自然語言的探索特別著迷。

當他讀大學的時候,他寫了一個名為 Anagram Genius 的軟體,當提供名稱或短語時,這個軟體可以巧妙地重新排列字母。

例如,「瑪格麗特‧希爾達‧撒切爾」(Margaret Hilda Thatcher)會變成「一個女孩,一個尖的瘋狂帽匠」(A girl, the arch mad-hatter)。

幾年後,作家丹‧布朗(Dan Brown)在《達文西密碼》中使用了 Anagram Genius 來創作情節糟糕的謎題。

這時,藏在圖書館裡,滕斯托爾-佩多開始構建一個可以回答幾百個問題的原型。

20年後,隨著亞馬遜 Alexa 和 Google Assistant 等語音助理平台的崛起,世界上最大的科技公司突然大步向滕斯托爾-佩多的方向發展。

智慧音箱已經成為這個行業最暢銷的產品之一; 據美國國家公共電台(NPR)和Edison Research的一份報告,僅在2018年,智慧音箱在美國家庭中的普及率就增長了78% 。

根據一項市場調查,人們讓智慧音箱回答問題的頻率比讓他們做其他任何事情的頻率都高。

滕斯托爾-佩多的願景已經成為主流,電腦可以一次性回答我們的問題,即提供一次性回答。

Internet及其支撐的價值數十億美元的商業生態系統正在發生不可逆轉的變化。訊息的創造、傳播和控制也是如此——這正是我們如何知道我們所知道的事情的本質。

二、

2007年,滕斯托爾-佩多和一些同事即將推出他們的第一款產品——一個名為「真知」(True Knowledge)的網站,它將為各種問題提供一次性答案。

在當時,他們的目標仍然是非主流的。「在 Google,有些人對我們正在做的事情非常過敏,」滕斯托爾-佩多說。「一次性回答問題的想法,是一種禁忌。」

他回憶起與一位 Google 高級員工的爭論,這位員工拒絕接受甚至存在單一正確答覆這種說法。

大型搜索引擎雖然已經索引了數十億網頁,但對用戶查詢卻沒有深入的瞭解。

相反,他們只是在美化猜測:你在 Google 欄輸入幾個關鍵詞,公司的網頁排名系統就會返回一長串由統計資料支援的關於你想知道什麼的猜測。

為了證明「真知」的一次性答案抱負是可能的,滕斯托爾-佩多和他在劍橋的小團隊開發了一個由三個主要部分組成的數字大腦。

第一個是自然語言處理系統,它試圖有力地解釋問題。例如,「有多少人居住」、「人口有多少」和「人口規模有多大」都將被表示為對一個地方居民數量的詢問。

系統的第二個組成部分收集事實。不同於搜索引擎,它簡單地將用戶指向網站,「真知」渴望自己提供答案。

它需要知道倫敦的人口是880萬,LeBron James有6英呎8英吋高(2.032公尺),等等。

這些事實中的絕大多數不是人工輸入系統的;這樣做會太費力。相反,它們是從結構化資料源中自動檢索的,其中訊息以計算機可讀的格式列出。

最後,系統必須對所有這些事實之間的關係進行編碼。程式員們創建了一個知識圖譜(knowledge graph),可以把它描繪成一個巨大的樹狀結構。

其基礎是「對象」這一類別,它包含了每一個事實。向上看,「對象」類別分為「概念對象」(用於社會和心理構造)和物理對象」(用於其他所有東西)。越高,分類就越精確。

例如,「軌道」類別被分成幾組,包括「路線」、「鐵路」和「道路」。

構建本體(ontology)是一項艱巨的任務,它擴充到數萬個類別,包括數以億計的事實。

但它提供的結構可以對新的訊息進行分類,就像把衣物分別放進衣櫃抽屜裡一樣。

知識圖譜在分類學意義上對關係進行編碼:道格拉斯冷杉(Douglas fir)是一種針葉樹,針葉樹是一種植物,等等。

但是,除了簡單地表示兩個實體之間存在聯繫之外,這個系統還描述了每種聯繫的性質:大笨鐘(Big Ben)位於英國。艾曼紐·馬克宏(Emmanuel Macron)是法國總統。

這意味著,「真知」有效地學習了一些關於世界的常識性規則,雖然對人類來說是顯而易見的,但對於計算機來說,這些規則很難理解。地標只能存在於一個地方。法國只能有一位現任總統。

對於滕斯托爾-佩多來說,最令人興奮的是,「真知」能夠處理那些事先沒有明確給出答案的問題。

想像一下,有人問,「蝙蝠是鳥嗎?」因為本體論將蝙蝠歸類為「哺乳動物」下的一個亞組,而鳥類則位於其他地方,所以系統可以正確地判斷蝙蝠不是鳥類。

「真知」越來越聰明,在向投資者推銷時,滕斯托爾-佩多喜歡對競爭者嗤之以鼻。

例如,他會在 Google 上搜索「瑪丹娜(Madonna,美國著名女歌手)單身嗎?」當搜索引擎返回鏈接「Unreleased Madonna single slips onto Net」時,其淺薄的理解是顯而易見的。

與此同時,「真知」從這個問題的措辭中得知,「單身」被用作形容詞,而不是名詞,它被定義為沒有與其他人有浪漫的關係。

所以,看到瑪丹娜和蓋·瑞奇(Guy Ritchie,英國男導演及編劇)是透過一個已婚的鏈接聯繫在一起的(當時),系統更有幫助地回答說,不,瑪丹娜不是單身。

投資者喜歡他們所看到的,於是在2008年打開了風險投資的水龍頭。

 「真知」擴充到大約30名員工,並搬到了劍橋的一個更大的辦公室。 但是這項技術最初並沒有在消費者中流行起來,部分原因是因為它的用戶界面是「一個醜陋的嬰兒」,滕斯托爾-佩多說。

所以他重新發佈了「真知」,這是一個設計簡潔的智慧型手機應用程式,可以在 iPhone 和 Android 設備上使用。

它有一個可愛的標誌(有一隻眼睛的笑臉)和一個朗朗上口的新名字 Evi (發音為 EE-vee)。 最重要的是,你可以向 Evi 提出你的問題,並聽到他們的回答。

2012年1月,在蘋果推出 Siri 語音助理幾個月後,Evi首次亮相,並在這家公司的 App Store 中名列第一,下載量很快就超過50萬次。

蘋果公司顯然被諸如「介紹Evi:Siri最大的新敵人」這樣的新聞標題激怒了,一度威脅要這個應用程式下線。

與此同時,滕斯托爾-佩多被收購邀約淹沒了。在與潛在的收購者舉行了一系列會議後,「真知」公司同意被收購。

幾乎每個人都可以保住工作,並留在劍橋,滕斯托爾-佩多將成為一款尚未發佈的語音設備產品團隊的高級成員。當這家設備在2014年問世時,其回答問題的能力將在很大程度上由 Evi 提供。

可能你已經猜出來了,「真知」的買家是亞馬遜,而這個設備就是 Echo。

為什麼Amazon的智慧音箱能夠領先搜尋引擎起家的 Google ? 語音時代,搜尋只需要唯一答案

 

 

36Kr
作者

36氪(36Kr.com)累計發表超過10.8萬條包含圖文、音訊、影片在內的優質內容。氪原創內容體系涵蓋新創公司、大公司、投資機構、地方產業與二級市場等內容模組,設置有快訊、深度商業報導

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則