Google 翻譯解密，導入神經機器學習讓翻譯結果更像「人話」

台灣 Google 今日邀請美國 Google 翻譯產品經理 Julie Cattiau 分享 Google 在翻譯上的斬獲，相較於過去單字翻譯成單字的技術，Google 自 2015 年秋季開始導入神經機器翻譯技術，讓不同語言間的翻譯變得更加連續且順暢，實際上是怎麼運作的呢？以下是 Google 的說明。

▲Google 翻譯產品經理 Julie Cattiau 自 2011 年加入 Google，先前在倫敦和加州擔任 YouTube 產品行銷經理，自 2014 年轉任 Google 翻譯產品經理。

為什麼 Google 這麼重視 Google 翻譯的發展？因為網路上有 50% 的內容是以英文呈現，但全球以英文為主要使用語言的使用者大概只有 20%，為了讓全世界的資訊可以更順暢的流通，因此翻譯服務扮演著很重要的角色，同時 Google 翻譯也整合了其他 Google 產品，包含 Chrome、Google 搜尋、Gmail、YouTube 等等，讓使用者在需要翻譯的時候都能取得翻譯服務。

根據 Google 的統計，全世界每天進行超過 10 億次的翻譯，每月有超過 10 億的活躍使用者（代表每 3 個網路使用者中就有 1 個是 Google 翻譯的常用者），有 92% 的 Google 翻譯使用者來自美國以外的國家，其中巴西是最大中的使用者，台灣則是 Google 翻譯成長最快的市場，以 Android 版來說，Google 翻譯每年成長兩倍，iOS 版也有 60% 的年成長。

從片段式 Google 翻譯到神經機器翻譯

相信不少人都有使用過 Google 翻譯的經驗，過去舊版的 Google 翻譯是以一個字對應一個字，例如雞對應到 Chicken、湯對應到 Soup 來進行翻譯，雞湯就變成 Chicken Soup，這樣的翻譯雖然不會有大錯，重點字都可以被翻譯出來，不過語意不一定容易被人理解，順暢度也比不上一般人說出來的話。

現在 Google 將從過去的片語式機器翻譯變成神經機器翻譯，以前的翻譯結果看起來會比較分離且片面，改用新的神經機器翻譯後會得到更連續且全面的結果。在這樣的努力下，中翻英的品質大幅提升，大部分的語言組合也有不錯的品質成長。

以川普就職典禮的一段話為例，在神經網路翻譯導入前，Google 英翻中的結果雖然重點都有被抓出來，不過語意不夠順暢，導入神經網路翻譯後，英翻中的結果更像一般人說出來的語句。

原文：We will build new roads and highways and bridges and airports and tunnels and railways all across our wonderful nation. We will get our people off of welfare and back to work, rebuilding our country with American hands and American labor.

舊 Google 翻譯：我們將建設新的道路和公路，橋樑，機場，隧道和鐵路所有在我們美好的國家。我們將讓我們的人民過福利和恢復工作，重建我們的國家與美國的雙手和美國勞工。

新 Google 翻譯：我們將在美好的國家建設新的道路，公路和橋樑，機場，隧道和鐵路。我們將使我們的人民擺脫福利，重返工作，用美國的手和美國勞工重建我們的國家。

▲以這張圖來說，黃色線代表人工翻譯的品質，綠色線代表新 Google 神經機器翻譯的品質，藍色線則代表過去 Google 翻譯邏輯的翻譯效果。

原本 Google 預計需要三年的時間才能推出神經機器翻譯技術，不過實際上只花了 13.5 個月就將翻譯成品陸續上線，成果超乎預期。自 2015 年 9 月 Google 開始以 TensorFlow 為核心執行專案，2016 年 2 月就取得了第一次產品的數據報告，2016 年 9 月就將新的中英翻譯上線，2016 年 11 月後則開始陸續推出更多語言，累積至今已提供 41 種語言對譯功能。

透過資料庫訓練的神經機器翻譯技術

相較於過去的 Google 翻譯，新的神經機器翻譯技術（NMT）模型架構較以前複雜許多，神經機器的翻譯模型並不是自動生成的，而是需要大量的模型訓練，每個模型訓練時間大約落在 2 至 3 週間，每種模型需要訓練的案例數量超過 1 億筆，由於有太多語言模型需要訓練，因此 Google 採用多元語言模式訓練，比方說將英文、日文、韓文放在一起相互訓練，讓兩種語言經過訓練後自動學習，不用額外訓練就可以自動翻譯另外一種全新語言（Zero-Shot），翻譯速度也變更快。

不過像是語法相似的繁體中文與簡體中文，Google 不諱言目前神經機器的中英翻譯目前尚還無法分別出台灣與中國用詞的差異，舉例來說像是台灣的水準和中國的水平、台灣的品質和中國的質量這類單字。由於繁中與簡中目前各別的資料庫還不足以訓練神經機器，因此兩套語言目前是套用同一套翻譯模型，只是單字從各自不同的資料庫來，神經機器翻譯比較大的斬獲是可以透過前後文推敲讓語句變得更順暢，可以降低誤差。

另外，如果一個句子混合了兩種語言，例如中英夾雜，這種翻譯結果 Google 目前為止是不翻譯英文，只將中文翻譯成英文，但未來會致力朝向翻譯全句語言讓他更順暢。

▲相較於舊 Google 翻譯，新的神經機器翻譯技術架構更為複雜。

▲應用到全世界各語系上，即便是不同的語言，相同意義的句子也會被歸類到同一區塊，進而提升翻譯品質與速度。

比起中英對譯目前有資料庫不足的瓶頸，有些雙語並行的國家就提供了 Google 翻譯更精準的資料庫，像是加拿大是英法雙與並行，因此 Google 可以取得一句英文、一句法文對應精準的翻譯，因此翻譯的準確度較高，同時，如果輸入越正式的句子至 Google 翻譯中，也能得到更準確的翻譯結果（因為越正式的句子翻譯資料庫比較豐富）。