
Google 今日正式在 Gemini 中推出原生 AI 圖像編輯功能,經過上個月的開發者測試後,該功能已開放部分用戶使用,並預計在未來數週內陸續擴大至全球大多數地區,支援超過 45 種語言。
這項新功能讓用戶可透過自然語言文字提示,對自行上傳或 Gemini 生成的圖片進行多步驟編輯,包含背景更換、物件替換、風格轉換、元素新增等,並且每次修改都會保留上下文,讓對話過程更加連貫。
圖像風格與細節編輯都變得更直觀
舉例來說,用戶可以輸入「幫這隻狗戴帽子,並把背景改成海灘」,Gemini 即會自動產出對應結果。甚至還可以模擬個人變裝風格,例如「換不同髮色的樣貌」、「把背景改成夜景城市」、「給人物加一副墨鏡」等等。
除了圖片修改,Google 也強調這項整合圖文的能力,可用於創作更有情境感的內容,例如撰寫附圖解的故事草稿、視覺化的步驟教學等。用戶可以請 Gemini 編寫關於「龍」的睡前故事,同時生成符合劇情的插圖。
圖像真偽辨識機制同步強化
為強化生成內容的辨識與透明性,Google 表示,所有透過原生圖像編輯功能產出的圖片都會嵌入不可見的 SynthID 數位浮水印,以利後續追溯圖像來源。同時也正在測試於圖像右下角顯示可見的「ai」標記,提醒使用者該圖片為 AI 生成。
這次圖像編輯功能的推出,延續 Google 先前在 AI Studio 推廣的 Flash 2.0 系統,其中強調其對文字與圖像的理解能力顯著提升,能夠生成更準確、語意一致的視覺內容。
目前此功能僅支援部分用戶,將於未來數週內擴大推出,預計將成為 Gemini 平台與 ChatGPT、Bing AI 等競爭的重要工具。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!