Google AI 創作工具更新，Veo 3 影像生成、Imagen 4 圖像生成、Lyria 2 音樂生成 | T客邦

半導體/電子產業 5G/網路 AI/大數據電動車/交通

加密貨幣/區塊鏈遊戲/電競雲端/資訊安全商業/金融

尖端科技 3C新品趨勢

抽獎/得獎公告體驗試玩活動課程講座

Google AI 創作工具更新，Veo 3 影像生成、Imagen 4 圖像生成、Lyria 2 音樂生成

Google 在 I/O 開發者大會上發表最新生成式媒體模型，包括能同步生成影像與聲音的 Veo 3、高解析度圖像生成模型 Imagen 4，以及開放更多使用權限的音樂生成模型 Lyria 2，官方並同步推出全新 AI 影像創作平台「Flow」，主打讓創作者以自然語言就能拍出電影級短片。

Google 指出，這些工具乃是與電影製片人、音樂人、藝術家與 YouTube 創作者等創意社群密切合作所開發，期盼讓 AI 成為創作靈感的助力而非取代者。

Veo 3：影片生成更升級！支援音效、對話同步登場

Veo 3 是 Google 目前最先進的影片生成模型，不僅延續 Veo 2 的高品質畫面，還首次加入「音訊生成」功能，從城市街道的車聲、人聲，到公園裡鳥鳴、甚至角色之間的對話，全都能自動生成，讓影像不再只是靜默的演出。

Veo 3 對文字與圖片的理解能力也更強，可依據使用者輸入的短篇故事，自動生成對應影片片段。不論是物理邏輯、角色嘴型對嘴能力、甚至鏡頭語言理解皆更進一步，目前已開放給美國地區 Gemini Ultra 訂閱用戶與 Vertex AI 企業客戶。

雖然最新模型為 Veo 3，不過 Veo 2 也同步獲得多項升級功能：

參考圖生影片：可提供角色、風格、場景參考圖，提升連貫性；
鏡頭運動控制：支援旋轉、推拉、變焦等電影鏡頭調度；
擴圖（Outpainting）：將直式畫面自動拓展為橫式，讓內容能自適應各種螢幕；
物件新增／移除：能理解物體比例、陰影與互動，畫面自然不突兀。

這些新功能已在 Flow 上線，未來幾週內也將導入至 Vertex AI API。

Imagen 4：從藝術照到海報通包

圖片生成模型 Imagen 4 也迎來升級，除了在毛髮、水滴、布料等細節上展現驚人解析力，還能生成抽象與寫實風格的圖像，支援最大 2K 解析度輸出，適合用於印刷或簡報。

特別的是，Imagen 4 的排版與拼字能力也顯著進步，讓使用者更容易自製海報、賀卡，甚至漫畫內容。Imagen 4 已整合至 Gemini、Whisk、Vertex AI 與 Google Workspace（Slides、Docs、Vids 等）中使用。此外，Google 也預告即將推出「加速版 Imagen 4」，速度較前代提升 10 倍，有望大幅提升創作節奏。

Lyria 2：音樂 AI 即時生成

Lyria 2 是驅動「Music AI Sandbox」背後的音樂生成模型，現已擴大開放予音樂人、製作人與詞曲創作者，Sandbox 提供一系列實驗性工具，幫助音樂人激發靈感、探索創新風格。

Google 同時推出支援即時創作的「Lyria RealTime」，已整合至 MusicFX DJ 與 AI Studio，也可透過 API 存取，用戶可在現場即時調整與演奏 AI 音樂，體驗前所未有的互動創作模式。

Flow 創作者專屬的 AI 導演工具

全新推出的「Flow」平台，整合 Google DeepMind 團隊最先進的 Veo、Imagen 與 Gemini 模型，使用者只需用自然語言敘述分鏡、角色、場景與風格，就能輕鬆組成一段段如電影般的短片。Flow 主打「為創作者而生」，目前於美國 Google AI Pro 與 Ultra 訂閱用戶開放使用，未來將拓展至更多市場。

AI 內容驗證工具「SynthID」全面升級

為避免生成式內容被誤用，Google 宣布擴展「SynthID」水印技術，目前已應用於超過百億個圖像、音訊與文字內容上，未來 Veo 3、Imagen 4 與 Lyria 2 所生成的內容也都將內嵌可追蹤水印。

同時推出「SynthID Detector」驗證平台，民眾可上傳影音、圖片或文件，自動判斷該內容是否為 AI 所生成，有效降低錯誤資訊與冒名風險。

#Google #flow #synthid #i/o 開發者大會 #生成式媒體模型 #veo 3 #imagen 4 #lyria 2 #ai 影像創作平台 #ai 導演工具

送【10個ChatGPT的好工具】電子書 Line brand icon

謹慎發言，尊重彼此。按此展開留言規則