iPhone上推出新的輔助功能Personal Voice,只要 15 分鐘你就能創造自己的AI版聲音

iPhone上推出新的輔助功能Personal Voice,只要 15 分鐘你就能創造自己的AI版聲音

每年五月的第 3 個星期四是「全球無障礙體認日」(Global Accessibility Awareness Day,GAAD),Apple 也宣布將推出更多針對無障礙者設計的軟體功能,內容包括預覽認知、視覺、聽覺和行動方面,例如透過「Assistive Access」功能可更輕鬆及直覺使用 iPhone 和 iPad,「Live Speech」能將打字轉化為語音,「Personal Voice」功能可打造與他們聲音類似的合成語音…等,多項創新工具也都將在今年稍晚陸續推出。

Assistive Access 簡化操作介面,讓認知功能障礙者更好上手

「Assistive Access」精簡 iPhone 及 iPad 上的介面,可選擇在桌面上顯示五個重要 App,包括電話、訊息、相機、照片、音樂,利用高對比按鍵和大型文字標籤的介面,輔助認知功能障礙者更好上手,讓操作也可以更直覺。另外,也開放使用者可以自訂常用功能在桌面上。

「Assistive Access」精簡 iPhone 及 iPad 上的介面,可選擇大圖示顯示,又或是條列顯示。

而這些功能中,只留下必備的核心功能,以減輕認知障礙使用者的負擔,例如相機 App 中,就以高對比按鍵標示快門位置;電話 App中,將電話及 FaceTime 整合在一起,對於想要進行語音或視訊通話時,都能更方便選擇;偏好以視覺進行溝通的使用者,「訊息」還加入一款只有 emoji 的鍵盤,並提供錄製影片訊息並與親朋好友分享的功能。照片 App 中也以簡化顯示介面,一頁大約六張照片的縮圖,更好瀏覽及點選;音樂也可以設定只播自己喜歡的歌曲。

在重要App 中,留下核心功能,以簡化操作介面,例如訊息中可選擇只用 emoji 鍵盤;照片則以大圖示顯示。

Live Speech 文字轉語音,輔助瘖啞人士對外溝通

「Live Speech」是文字轉語音的技術,在 iPhone、iPad 和 Mac 上都可使用,不論是播打電話、FaceTime,或是與身邊的人互動時,可以在輸入文字後,轉為語音給對他人聽,也可以將常用語句儲存起來,輕敲一下就可在與親朋好友和同事的即時對話中快速套用。

在 iPhone、iPad 和 Mac 上的「Live Speech」功能,可將輸入的文字轉為語音,就可進行對話、電話或 FaceTime 通話。

Personal Voice 用機器學習合成和自己的聲音

「Personal Voice」是一項創新技術,讓用戶能夠輕鬆合成自己的聲音,再與周遭的人進行互動。針對可能失去言語能力的使用者,如罹患肌萎縮性脊髓側索硬化症(ALS)或其他會逐漸侵蝕說話能力的疾病的人,可以創造與自己聲音相似的語音。

使用這項技術時,會隨機顯示一段文字,只需要在 iPhone 或 iPad 上錄製自己的聲音進行合成即可,而樣的朗讀過程只需花費 15 分鐘的時間便能完成訓練。而實現這一功能的核心是神經網路引擎,運用了文字轉語音技術和語音合成技術。此外,機器學習的過程都是只在設備裡進行,任何第三方應用程式都無法在背景存取資料,再加上設備本身也有臉部辨識、密碼鎖等保護,可降低被盜用的風險。

「Personal Voice」讓可能失去言語能力的使用者,可以創造與他們聲音相似的語音,並可搭配「Live Speech」使用。

Point and Speak 輔助視覺障礙者操作實物

「Point and Speak」功能的加入,讓視覺障礙使用者能夠更輕鬆地與擁有多個文字標籤的實際物體進行互動。例如在使用微波爐時,「Point and Speak」會結合相機和光學雷達掃描儀運作,並透過裝置端的機器學習,根據使用者手指在數字鍵盤上的移動位置,朗讀出按鍵上的文字。

此外,「Point and Speak」功能已內建於 iPhone 和 iPad 的「放大鏡」App 中。它可以與「旁白」功能一同使用,並結合其他「放大鏡」功能,例如人物偵測、門偵測和圖片描述」以引導使用者更好地了解周遭環境。

「放大鏡」中的「Point and Speak」功能,可讓視覺障礙使用者更輕易地與有多個文字標籤的物體互動。

WL.
作者

PC home雜誌、T客邦產業編輯,主要負責蘋果、手機、筆電、桌機、平板等產業領域,以及相關硬體的教學以及評測、軟體相關教學報導。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則