聯發創新基地正式發表全新 MediaTek Research Breeze 3(簡稱 MR Breeze 3)系列,包含能辨識台語的 Breeze ASR 26、能開口說台語的 BreezyVoice 26,以及專為台灣社會情境打造的安全防護模型 Breeze Guard 26。這標誌著在地化 AI 邁入新里程碑,不僅更懂台灣文化,還能守護數位環境安全。
聽攏有!Breeze ASR 26 克服台語辨識難關
台語擁有豐富的聲調與多樣的書寫系統,對傳統 AI 來說一直是個大挑戰,國際主流模型常在遇到台語時顯得心有餘而力不足。Breeze ASR 26 為了解決這個問題,以 OpenAI Whisper 為基礎,採用約 10,000 小時的台語合成語音資料進行訓練。
這次訓練的亮點在於,資料並非生硬的朗讀稿,而是模擬日常生活的對話情境,涵蓋語速變化、在地口語用詞,甚至是台灣人最擅長的「國台語夾雜」。現在只要在 Breeze AI 的 LINE 官方帳號開啟麥克風,不管是說「你這個 kha-bang 有夠媠」這種混合句子,模型都能精準辨識並轉成文字。

BreezyVoice 26 語音合成超自然
去年 MR Breeze 2 的自然台灣口音中文語音合成已備受好評,這次 BreezyVoice 26 則更進一步挑戰「講台語」。該模型基於 CosyVoice 2 架構開發,同樣透過大量合成語音資料學習,讓文字轉語音的表現極為流暢。
根據人工評測結果,BreezyVoice 26 的語音品質獲得滿分 5 分(MOS 評測)的優異成績。評測者普遍認為聽起來就像真人在說話,能完美掌握台灣人講台語時特有的語調與節奏。例如輸入「你這個帳戶的年利率有 3%」,模型便能迅速生成一段親切且自然的台語語音。

Breeze Guard 26 專防本土詐騙與歧視
除了視聽能力的進化,聯發創新基地也注意到國際安全模型在對應台灣特定風險時的不足。雖然國外模型懂英文安全準則,但對於台灣本土常見的詐騙術語、文化脈絡下的歧視言論或政治操弄,判斷往往不夠精準。
Breeze Guard 26 以 Breeze 2 8B 模型為核心,針對超過 12,000 筆台灣風險情境資料進行微調,範圍涵蓋不雅用語、不實資訊、詐騙與社會文化歧視等。這讓 AI 在服務台灣使用者時,能建立一道更符合在地法規與社會價值的防護牆。

聯發科的在地化策略
過去 MediaTek Research 就曾推出多個繁體中文大型語言模型,顯示出其與國際巨頭做出區隔的野心。這次 MR Breeze 3 更是將 ASR(語音辨識)與 TTS(語音合成)技術全面導入本土語言。目前 Breeze ASR 26 與 Breeze Guard 26 已決定開源供大眾使用,聯發創新基地也同步發表了 Breeze Taigi Benchmark 與 TS-Bench 評測基準,希望藉此邀請學界與業界共同完善台灣的 AI 生態系。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!