FB 建議貼文

選取貼文複製成功(包含文章連結)!

Gemini Live 新增「視覺化指引」功能,讓 AI 助理直接在螢幕標示出重點

Gemini Live 新增「視覺化指引」功能,讓 AI 助理直接在螢幕標示出重點

Google 正在全面升級 Gemini Live,使其成為一個更實用、更貼近日常生活的 AI 助理。新版本的 Gemini Live 能在使用者分享相機畫面時提供「視覺化指引」,讓人能更清楚看出 AI 是在指哪一個;該功能未來在不管是 Android 還是 iOS 裝置上皆可使用。另外還有更自然的語音模型,改善 Gemini Live 在語調、節奏和音高等語音方面的表現。

全新視覺化指引:讓 AI 不只「看見」,還能「點出來」

去年 Google 在 Made by Google 活動中為 Pixel 9 推出的 Gemini Live,讓使用者能與 Gemini 進行流暢自然的對話,還能透過鏡頭或螢幕分享,讓 Gemini 看見你所見。這次新加入的「視覺化指引」功能,將這項能力提升到全新層次。當你分享鏡頭時,Gemini 不僅能「看見」畫面內容,還能直接在你的螢幕上標示出重點。

舉例來說,當你不知道該選哪一雙球鞋時,Gemini 能同時「看見」兩雙鞋,並直接標示出最符合你心中搭配的那一雙。或者,當你在工具箱裡找不到特定工具時,只要對準鏡頭,Gemini 就能準確地指出正確的工具。

這項功能將在 8 月 28 日隨著 Pixel 10 系列新機上市,並在一週內陸續推廣至其他 Android 裝置,iOS 裝置則會在未來幾週內推出。

更自然、更有情感的對話體驗

Google 同時也即將推出全新的模型更新,改善 Gemini Live 在語調、節奏和音高等方面的表現,讓對話聽起來更具情感且更自然。未來幾週內,使用者將能體驗到:

  • 更流暢、更直覺的互動:Gemini 會根據談話內容給予更恰當的回應。如果你正在談論一個壓力較大的話題,它可能會以更平靜、沉穩的聲音回應。

  • 自訂 Gemini 的語速: 無論是需要放慢速度來做筆記,或是要求它加快語速以節省時間,你都能輕鬆調整。甚至可以要求它使用有趣的口音,為對話增添樂趣。

  • 生動的敘事能力:試著請 Gemini 從凱撒大帝的角度講述羅馬帝國的故事,它將會用豐富、引人入勝的語氣,甚至帶上角色口音,為你帶來一場身歷其境的歷史之旅。

Google 最終的願景是讓 Gemini 成為一個能陪伴你每一天的通用 AI 助理,能理解周遭世界、協助你完成各種任務,並能與你一同探索新奇想法。

ycr
作者

PC home 雜誌、T 客邦產業編輯,也負責 T 客邦影新聞 YouTube 頻道短影音製作。關注 AI 相關應用,並有軟體教學報導。(大頭貼為 AI 生成)

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則