MOVI離線語音辨識系統，讓Arduino聲控更方便

提到語音辨識以及聲控，大家最熟悉的系統應該就是Apple的語音助理Siri，不過不少語音辨識系統在過程中需要使用網路傳輸，這對手機而言還不是很大的問題，但是對於Arduino這類微控制器或開發板來說，要隨時隨地連上網路就不一定那麼方便。

透過雲端伺服器進行語音辨識

粗略地說，語音辨識的過程可以分為聲音辨識以及自然語言分析等2個階段，首先在聲音辨識階段，系統會透過麥克風等設備收錄聲音，並透過運算與分析，將這些聲音轉換為文字。接著在自然語言分析階段，系統就會對這些文字分析，去推測使用者說這具話的意思，然後再轉換為指令，控制電腦或其他裝置。

不過語音辨識系統需要仰賴資料庫中的大量數據進行比對、分析，而且對運算能力的需求也不低，所以對於手機等儲存空間與效能較為有限的裝置而言，為了要完成上述2個階段的工作，大多會透過雲端伺服器協助。當使用者下達語音指令後，並非由手機進行語音辨識，而是將該段錄音上傳到雲端伺服器，並由伺服器進行辨識。

以Apple的語音助理Siri為例，當使用者對系統說出「撥電話給老爸」後，系統就會把這段聲音上傳，雲端伺服器在接到聲音後，將這段聲音辨識為「撥電話給老爸」這段文字，然後對文字進行分析，瞭解使用者的用意後，回傳「使用電話撥號給通訊錄中的父親」的指令，手機在接到回傳指令後就會自動開始撥號。

▲Siri的語音辨識功能相當強大，有不少人會跟Siri聊天。（圖片來源：維基百科，本圖採用創用CC姓名標示分享，作者為Vasile Cotovanu）

免網路也能通

對智慧型手機而言，無論使用行動網路或是Wi-Fi連上網路都相當方便，頂多是使用行動網路時可能需支付額外通訊費用。但是對於Arduino這類微控制器或開發板來說，它們可能被放做成各式不同的裝置，放在比較奇怪的地方使用，不一定能方便地連接至網路。舉例來說，如果把自己透過Arduino製作的聲控電燈開官放屋頂陽台，可能就接收不到家中的Wi-Fi，要使用有線網路也不是那麼方便。

MOVI就是為了要讓Arduino能夠具有離線語音辨識功能而開發的套件，它的名稱取自My Own Voice Interface（我的語音介面）的第一個字母，它最大的特色就是內建容量高達2GB的語音資料庫，它能夠在沒有網路的環境離線運作，可以辨識約200句英文句子，並且能夠辨識不同人的語音（可辨識多人腔調）。MOVI讓使用者能夠以不同的方式控制Arduino，使用者不需使用按鍵、遙控器或是透過手機操作，只要透過語音就能對Arduino下達指令。

MOVI採用Allwinner A13處理器與Debian作業系統，裝上Arduino後不需額外安裝其他電源即可運作。使用者可以透過程式編輯MOVI的觸發指令，在預設狀態下，系統在聽到「MOVI」後，才會開始辨識後方的語音，使用者可以將觸發指令改為Computer、Hello，或是其他各種指令，也可以關閉觸發指令讓MOVI接收所有周遭的聲音。另一方面，MOVI也內建的語音合成功能，使用者能夠過過該功能讓MOVI「講話」，或是用來表示工作狀態。

MOVI的預定售價為美金80元（約合新台幣2,480元），預定上市時間為2016年2月。