ADVERTISEMENT
Google Gemini 持續進化,現在除了支援文件與圖片上傳,使用者也能直接將影片檔案加入提示中,讓 AI 分析影片內容並回答相關問題。Gemini 不僅能針對影片中的畫面進行辨識,還能深入分析音訊,帶來更豐富、直覺的互動體驗。
舉例來說,筆者上傳了一段講解「研究機構調查有 84% 的受訪者願意為 Apple AI 付費」的影片(影片內容可參考超連結),並詢問內容重點,Gemini 隨即根據畫面與語音內容,生成清楚的摘要說明;若上傳的是螢幕錄影,只要提問「影片中出現的時間是什麼?」也能得到正確答案。此外,用戶也可要求 Gemini 為影片撰寫描述,例如上傳一段水族館「鯨鯊餵食秀」的影片,Gemini 便會自動產生如下生動的描述:
ADVERTISEMENT
「這是一段水下影片,可能是在水族館拍攝。畫面中有一隻巨大的鯨鯊,背部呈深藍灰色,腹部為淺色。它的身上似乎有淺色的斑點,這是鯨鯊的典型特徵。影片中還可以看到許多其他小魚群,其中有些是銀白色的魚,還有一些是帶有黃色尾鰭的魚,牠們圍繞著鯨鯊游動。鯨鯊在水中緩慢地垂直向上移動,牠的嘴巴似乎是張開的,像是在濾食水中的浮游生物。畫面底部偶爾會出現其他種類的魚,例如一隻看起來像是魟魚的生物,以及幾隻體型較大的魚從畫面下方游過。影片中還能聽到背景有一些環境聲音,例如人們的說話聲和一些日語解說。解說中提到了鯨鯊(日語中稱作「ジンベエザメ」)以及牠們的濾食行為,甚至提到了牠們一次能吸入約 100 公升的海水。整體而言,這是一段展示鯨鯊在水下優雅游動和濾食行為的影片。」
根據實測,目前無論是手機 App 或網頁版都已開放影片上傳與分析功能。若你的帳戶已開啟此功能,在手機版的聊天介面中點選加號選單,再選擇「相簿」或「檔案」,即可挑選影片上傳;若檔案呈現灰色,則表示目前尚不支援該格式。而在電腦的網頁版上,只需將影片拖曳至聊天介面中即可完成上傳,若不支援則會顯示「不支援的檔案類型」提示。
影片成功上傳後,Gemini 會在聊天視窗中顯示完整的播放器介面,方便使用者即時預覽與回顧影片內容。
ADVERTISEMENT
值得一提的是,目前 Google 仍未更新內建的 Gemini 相機以支援直接錄製影片,目前僅能拍攝照片作為提示內容使用。
參考資料:9to5Google
ADVERTISEMENT