Siri 對戰 Android 語音辨識:持續兩周的深度測試

Siri 對戰 Android 語音辨識:持續兩周的深度測試

本文作者David Pogue,原文載於《紐約時報》。「你的評論是我讀到過的最愚蠢的東西。 我竭力不去描述你聽上去多麼的愚蠢,因為這簡直就是對我自己的褻瀆。」我在兩周前發表對 Google 手機 Moto X 的評論之後便收到這封使我歡欣鼓舞的郵件。

Siri 對戰 Android 語音辨識:持續兩周的深度測試「你的評論是我讀到過的最愚蠢的東西。 我竭力不去描述你聽上去多麼的愚蠢,因為這簡直就是對我自己的褻瀆。」我在兩周前發表對 Google 手機 Moto X 的評論之後便收到這封使我歡欣鼓舞的郵件。有讀者對我評論中的這句「Android 的語音命令仍然無法與 Siri 匹敵」特別不滿。

夥計,我的確是個傻子。誰會傻到願意在一場宗教戰爭中打出鮮明的旗幟?這樣寫豈不更加明哲保身:「保守黨比自由黨長相更好看」或「反墮胎人士和支持墮胎的人相比是更糟糕的司機。」

但是,手機的語音辨識技術的優越性可不是個無聊的問題。如今觸控式螢幕手機的大勢已不可阻擋,而語音辨識也因此變得極為重要。沒有實體按鍵或按鈕,輸入文字和軟體控制有時相當繁瑣複雜。所以我決定花兩個星期沉浸在語音辨識的世界中:在所到之處攜帶 iPhone 和運行 Android 作業系統的手機,與這兩款手機同時對話。我想由此來認識它們的不同,它們的優勢和弱點。

人們談論語音辨識時,經常混淆三種不同的功能,即聽寫功能(手機轉換語音到文字),命令功能(讓您通過談話實現對手機的操作)和網路資訊搜尋。這三種功能在 iPhone 和 Android 手機的表現不盡相同。

Siri 對戰 Android 語音辨識:持續兩周的深度測試

聽寫功能在這兩個系統上的表現都堪稱可憐,你常常會聽到人們對著他們的手機大吼「我放棄!」。 Android 手機和 iPhone 的 Siri 語音功能都會發生許多轉錄錯誤。但在考慮到說話的人的口音、說話時與麥克風的距離以及環境中的噪音影響這些因素後,錯誤的產生就顯得情有可原了。

最新的 Android 版本並不需要網路連接來實現基本聽寫。並且當你說話的同時文字便會逐一顯現在 Android 螢幕上,而 Siri 則是待語音完畢後轉錄出相應文字。另一方面,Siri 能聽懂「大寫」、「全部大寫」、「沒有空格」,以及各種標點符號的語音 - 「冒號」、「破折號」、「星號」、「省略號」等。 Android 能聽懂的只有基本的符號,如「句號」、「逗號」和「驚嘆號」。

手機語音操作命令則更為成熟。這是當你說:「打電話給媽媽」「發簡訊給 Emily」「7:30 叫醒我」「播放 Billy Joel 的歌」「提醒我回家時餵貓」等等。在不觸摸你的手機的情況下對其進行操作對安全性來說是非常重要的。

說話的命令方式顯然比觸碰來得高級且安全。從便利程度來講,說話肯定比在一螢幕的圖示中尋找並打開「憤怒的小鳥」來得速度要快;說出「把我的鬧鐘定在 8 時」比在鬧鐘程式中設置要快上許多。

而 Siri 在手機語音命令方面更為先進。當你在駕車時聽到傳入簡訊的聲音,可以說,「查看我的新簡訊」,Siri 便可大聲讀取並甚至聽寫你的答覆,全程不需要你的眼睛偏離道路。 Android 暫時無法做到這一點。

兩個系統都可以命令內建的應用程式完成以下動作,如「週四中午與 Bob Barnet 開會」(日曆),「記得還錢給 Harold」(筆記),「發送電子郵件給 Danny Cooper」(電子郵件)以及「Steve Alper 的住址是什麼?」(連絡人)。

Android 在網路搜尋方面則完勝 iOS,這多少歸功於 Google 強大而迅速的搜尋。兩種手機都能很好地獲取天氣更新(「週末底特律的天氣怎樣?」),時間(「比利時現在幾點?」),股票價格,體育資訊(「下場牛仔比賽是什麼時候?」),轉換(「32 歐元兌換多少美元?」),計算(「還有幾天是情人節?」)以及各類網路搜尋查詢(「一塊 Hershey 巧克力有多少卡路里?」「下一次日蝕是什麼時候?」「怎麼拼寫 schadenfreude?」「1985 年雪佛蘭的圖片」,等等)。

Android 特別驚人的是語音撥號(「呼叫 34 街的 Macy's 百貨」)和查詢方向(「去拉瓜迪亞機場的公共交通」),因為它的地圖應用程式為此打下了堅實的基礎。同時 Android 面對一個接一個的連串發問也更聰明。如果你的第一個問題是,「誰是希拉蕊.克林頓?」,你可以跟進問,「她的丈夫是誰?」

另外,Google 有一個內建的類似 Shazam 的音樂識別功能。點擊語音辨識圖示,讓手機聽任何正在播放的歌曲,即可識別歌曲和歌手。

不幸的是,Android 有一個致命的弱點:要發出語音命令,你必須在 Google 搜尋欄點擊麥克風圖示,且只有在主螢幕上或 Google Now 螢幕上(從底部向上輕掃)。所以,你無法在手機被鎖定或正在使用另一個應用程式時發出命令,除了例如Motorola的 Moto X 這樣的新產品可以在任何時間進行偵聽。而在 iPhone 上,按住 Home 按鈕或你的耳機上的按鍵,即便在手機休眠和使用其它應用程式是也可實現語音指令功能。

Siri 在餐廳和電影方面應用更全面。兩款手機都能聽懂 「附近好一點的印度餐館」「打電話在 Daleford 路上的 Olive Garden。」但 Siri 由於整合了 OpenTable.com 可以幫你預訂,例如 「預約星期六晚上 7 點,不那麼貴的義大利餐廳。」同樣,Siri 提供電影類的更加綜合的答案,「這周有什麼新電影上映」「《The Way, Way Back》的影評如何」,或「今天《藍色小精靈 2》的放映時間是什麼」。Android 相比只是顯示 Google 的搜尋結果。

再有就是產品個性的問題:Siri 很有個性,Android 則冷冰冰的。我是指關於互動中的俏皮話、笑話、態度及稱呼。如果你問 Siri:「誰是你爸爸?」,她會回答:「你是。我們能回去工作了嗎?」「請把我發射上太空 Siri」,她答「請脫掉你的腰帶、鞋子和外套,掏空你的口袋。」「對我說髒話」,她答「腐殖質。堆肥。浮石。淤泥。礫石。」

但在蘋果和 Google 的粉絲大戰中,幽默可沒有立足之地。當你誇讚 Siri 的個性,蘋果的仇敵會這樣反應:「也就是個登不了大堂的沒用把戲!你聽上去蠢極了好嗎,我只是忍住沒說而已。」於是,你得被逼著在兩個不同的哲學陣營中做出選擇。 (雖然有 Windows Phone 和黑莓,但他們的語音辨識比較初級。)粉絲們何不各自放下手中的劍,花點時間研究一下這兩個系統呢。(這裡是一個很好的 Android 的語音命令清單:http://j.mp/12kEFDo 這個是 Siri 的:http://j.mp/16Yy4yy

雖然 Siri 有自身的優勢, 但差距已經大幅縮減,兩個系統都在迅速提高。Android 近期才添加了手機控制功能,之前只有網路搜尋。今年秋季即將更新的 iOS 7 會使 Siri 獲得更舒服的說話聲音,更快的搜尋和通過語音改變手機設置(「打開飛行模式」, 「調高亮度」,「打開藍牙」)的能力 。

我們可以明確的是:手機語音辨識完善得越來越快。 也許不久,我們將不是將通過手機溝通,而是更多的和手機溝通。(nytimes.com)

Siri 對戰 Android 語音辨識:持續兩周的深度測試

36Kr
作者

36氪(36Kr.com)累計發表超過10.8萬條包含圖文、音訊、影片在內的優質內容。氪原創內容體系涵蓋新創公司、大公司、投資機構、地方產業與二級市場等內容模組,設置有快訊、深度商業報導

使用 Facebook 留言
液態氮
1.  液態氮 (發表於 2013年8月23日 14:29)
目前用的是iphone4,
所以沒有Siri..
等換新的手機後會多玩玩看XD
(不管是Andraid還是Apple)
發表回應
謹慎發言,尊重彼此。按此展開留言規則