MOVI離線語音辨識系統,讓Arduino聲控更方便

MOVI離線語音辨識系統,讓Arduino聲控更方便

提到語音辨識以及聲控,大家最熟悉的系統應該就是Apple的語音助理Siri,不過不少語音辨識系統在過程中需要使用網路傳輸,這對手機而言還不是很大的問題,但是對於Arduino這類微控制器或開發板來說,要隨時隨地連上網路就不一定那麼方便。

透過雲端伺服器進行語音辨識

粗略地說,語音辨識的過程可以分為聲音辨識以及自然語言分析等2個階段,首先在聲音辨識階段,系統會透過麥克風等設備收錄聲音,並透過運算與分析,將這些聲音轉換為文字。接著在自然語言分析階段,系統就會對這些文字分析,去推測使用者說這具話的意思,然後再轉換為指令,控制電腦或其他裝置。

不過語音辨識系統需要仰賴資料庫中的大量數據進行比對、分析,而且對運算能力的需求也不低,所以對於手機等儲存空間與效能較為有限的裝置而言,為了要完成上述2個階段的工作,大多會透過雲端伺服器協助。當使用者下達語音指令後,並非由手機進行語音辨識,而是將該段錄音上傳到雲端伺服器,並由伺服器進行辨識。

以Apple的語音助理Siri為例,當使用者對系統說出「撥電話給老爸」後,系統就會把這段聲音上傳,雲端伺服器在接到聲音後,將這段聲音辨識為「撥電話給老爸」這段文字,然後對文字進行分析,瞭解使用者的用意後,回傳「使用電話撥號給通訊錄中的父親」的指令,手機在接到回傳指令後就會自動開始撥號。

MOVI離線語音辨識系統,讓Arduino聲控更方便

▲Siri的語音辨識功能相當強大,有不少人會跟Siri聊天。(圖片來源:維基百科,本圖採用創用CC姓名標示分享,作者為Vasile Cotovanu)

免網路也能通

對智慧型手機而言,無論使用行動網路或是Wi-Fi連上網路都相當方便,頂多是使用行動網路時可能需支付額外通訊費用。但是對於Arduino這類微控制器或開發板來說,它們可能被放做成各式不同的裝置,放在比較奇怪的地方使用,不一定能方便地連接至網路。舉例來說,如果把自己透過Arduino製作的聲控電燈開官放屋頂陽台,可能就接收不到家中的Wi-Fi,要使用有線網路也不是那麼方便。

MOVI就是為了要讓Arduino能夠具有離線語音辨識功能而開發的套件,它的名稱取自My Own Voice Interface(我的語音介面)的第一個字母,它最大的特色就是內建容量高達2GB的語音資料庫,它能夠在沒有網路的環境離線運作,可以辨識約200句英文句子,並且能夠辨識不同人的語音(可辨識多人腔調)。MOVI讓使用者能夠以不同的方式控制Arduino,使用者不需使用按鍵、遙控器或是透過手機操作,只要透過語音就能對Arduino下達指令。

MOVI採用Allwinner A13處理器與Debian作業系統,裝上Arduino後不需額外安裝其他電源即可運作。使用者可以透過程式編輯MOVI的觸發指令,在預設狀態下,系統在聽到「MOVI」後,才會開始辨識後方的語音,使用者可以將觸發指令改為Computer、Hello,或是其他各種指令,也可以關閉觸發指令讓MOVI接收所有周遭的聲音。另一方面,MOVI也內建的語音合成功能,使用者能夠過過該功能讓MOVI「講話」,或是用來表示工作狀態。

MOVI的預定售價為美金80元(約合新台幣2,480元),預定上市時間為2016年2月。

MOVI離線語音辨識系統,讓Arduino聲控更方便

▲目前MOVI還在試作階段,上方紅色電路板階為MOVI元件,最終外型可能有所改變。

MOVI離線語音辨識系統,讓Arduino聲控更方便

▲MOVI採用Allwinner A13處理器,其運作時脈為1GHz。

MOVI離線語音辨識系統,讓Arduino聲控更方便

▲使用者可以自行撰寫程式,編輯MOVI在收到語音指令後的反應。

MOVI離線語音辨識系統,讓Arduino聲控更方便

▲舉例來說,使用者可以自行製做變色電燈,並透過MOVI控制Arduino,來調整燈光的顏色。

延伸閱讀:

結合Raspberry Pi與Arduino又可以跑Android的多功能開發板UDOO  Neo

將Arduino 變成Game Boy,還可自行設計遊戲的Arduboy

Raspberry Pi 2接招,Microsoft發布Windows 10 IoT Core預覽版

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則