RetroArch透過文字辨識系統,為懷舊RPG遊戲加上語音

RetroArch透過文字辨識系統,為懷舊RPG遊戲加上語音

ADVERTISEMENT

以開源、免費使用為特色的萬用模擬器RetroArch集合了許多社群開發者的力量,在功能與模擬還原度等層面都有相當出色的表現。這次官方分享的開發中進度是透過文字辨識系統(OCR)自動辨識RPG遊戲中的對話字幕,並透過語音引擎將文字資料唸出來,讓遊戲也有「真人配音」。

把RPG的對話唸給你聽

在RetroArch開發團隊所展示的影片中,他們使用任天堂Super Famicom平台的《創世封魔錄》(Soul Blazer)進行示範。

當遊戲進行遇到文字字幕時,玩家可以將模擬器切換至暫停,然後系統就會自動偵測文字的範圍,並透過文字辨識系統解讀畫面上的文字,之後會將解讀出來的資料送至語音引擎,待玩家解除暫停之後,系統就會將圈選的文字唸給玩家聽。

開發團隊強調這只是開發中的進度展示,不代表最終功能的使用體驗。這也暗示著正式版功能可能會強化辨識的速度與流程,進而在不影響遊戲流暢度的前提下使用這個功能。

RetroArch透過影片展示開發中的文字辨識與語音功能。

當遊戲過程遇到文字時,就可暫停遊戲進行辨識。

系統會自動偵測文字範圍並辨識,最後則會輸出語音。

▲從影片中可以發現辨識過程不是很流暢,但應該會在正式版大幅改近。

這個技術的核心在於偵測文字範圍以及文字辨識系統,如果在未來能夠將辨識過後的文字先輸入翻譯軟體,然後再以語音念出,搞不好還能將從來沒有推行過中文版的遊戲,變成有「狂新聞」風格中文語音的版本喔。

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則