FB 建議貼文

選取貼文複製成功(包含文章連結)!

Google AI 創作工具更新,Veo 3 影像生成、Imagen 4 圖像生成、Lyria 2 音樂生成

Google AI 創作工具更新,Veo 3 影像生成、Imagen 4 圖像生成、Lyria 2 音樂生成

Google 在 I/O 開發者大會上發表最新生成式媒體模型,包括能同步生成影像與聲音的 Veo 3、高解析度圖像生成模型 Imagen 4,以及開放更多使用權限的音樂生成模型 Lyria 2,官方並同步推出全新 AI 影像創作平台「Flow」,主打讓創作者以自然語言就能拍出電影級短片。

Google 指出,這些工具乃是與電影製片人、音樂人、藝術家與 YouTube 創作者等創意社群密切合作所開發,期盼讓 AI 成為創作靈感的助力而非取代者。

Veo 3:影片生成更升級!支援音效、對話同步登場

Veo 3 是 Google 目前最先進的影片生成模型,不僅延續 Veo 2 的高品質畫面,還首次加入「音訊生成」功能,從城市街道的車聲、人聲,到公園裡鳥鳴、甚至角色之間的對話,全都能自動生成,讓影像不再只是靜默的演出。

Veo 3 對文字與圖片的理解能力也更強,可依據使用者輸入的短篇故事,自動生成對應影片片段。不論是物理邏輯、角色嘴型對嘴能力、甚至鏡頭語言理解皆更進一步,目前已開放給美國地區 Gemini Ultra 訂閱用戶與 Vertex AI 企業客戶。

雖然最新模型為 Veo 3,不過 Veo 2 也同步獲得多項升級功能:

  • 參考圖生影片:可提供角色、風格、場景參考圖,提升連貫性;
  • 鏡頭運動控制:支援旋轉、推拉、變焦等電影鏡頭調度;
  • 擴圖(Outpainting):將直式畫面自動拓展為橫式,讓內容能自適應各種螢幕;
  • 物件新增/移除:能理解物體比例、陰影與互動,畫面自然不突兀。

 

 

 

這些新功能已在 Flow 上線,未來幾週內也將導入至 Vertex AI API。

Google AI 創作工具更新,Veo 3 影像生成、Imagen 4 圖像生成、Lyria 2 音樂生成

Imagen 4:從藝術照到海報通包

圖片生成模型 Imagen 4 也迎來升級,除了在毛髮、水滴、布料等細節上展現驚人解析力,還能生成抽象與寫實風格的圖像,支援最大 2K 解析度輸出,適合用於印刷或簡報。

Google AI 創作工具更新,Veo 3 影像生成、Imagen 4 圖像生成、Lyria 2 音樂生成

特別的是,Imagen 4 的排版與拼字能力也顯著進步,讓使用者更容易自製海報、賀卡,甚至漫畫內容。Imagen 4 已整合至 Gemini、Whisk、Vertex AI 與 Google Workspace(Slides、Docs、Vids 等)中使用。此外,Google 也預告即將推出「加速版 Imagen 4」,速度較前代提升 10 倍,有望大幅提升創作節奏。

Lyria 2:音樂 AI 即時生成

Lyria 2 是驅動「Music AI Sandbox」背後的音樂生成模型,現已擴大開放予音樂人、製作人與詞曲創作者,Sandbox 提供一系列實驗性工具,幫助音樂人激發靈感、探索創新風格。

Google 同時推出支援即時創作的「Lyria RealTime」,已整合至 MusicFX DJ 與 AI Studio,也可透過 API 存取,用戶可在現場即時調整與演奏 AI 音樂,體驗前所未有的互動創作模式。

Flow 創作者專屬的 AI 導演工具

全新推出的「Flow」平台,整合 Google DeepMind 團隊最先進的 Veo、Imagen 與 Gemini 模型,使用者只需用自然語言敘述分鏡、角色、場景與風格,就能輕鬆組成一段段如電影般的短片。Flow 主打「為創作者而生」,目前於美國 Google AI Pro 與 Ultra 訂閱用戶開放使用,未來將拓展至更多市場。

AI 內容驗證工具「SynthID」全面升級

為避免生成式內容被誤用,Google 宣布擴展「SynthID」水印技術,目前已應用於超過百億個圖像、音訊與文字內容上,未來 Veo 3、Imagen 4 與 Lyria 2 所生成的內容也都將內嵌可追蹤水印。

同時推出「SynthID Detector」驗證平台,民眾可上傳影音、圖片或文件,自動判斷該內容是否為 AI 所生成,有效降低錯誤資訊與冒名風險。

洪詩詩
作者

PC home雜誌、T客邦產業編輯,長期報導手機、行動裝置、電信商以及行動支付、電商相關領域,負責手機平板器材、5G網路、無線耳機等產品評測,以及相關教學報導。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則