Google Gemini 推出原生 AI 圖像編輯功能，支援自然語言編修與風格變換

Google 今日正式在 Gemini 中推出原生 AI 圖像編輯功能，經過上個月的開發者測試後，該功能已開放部分用戶使用，並預計在未來數週內陸續擴大至全球大多數地區，支援超過 45 種語言。

這項新功能讓用戶可透過自然語言文字提示，對自行上傳或 Gemini 生成的圖片進行多步驟編輯，包含背景更換、物件替換、風格轉換、元素新增等，並且每次修改都會保留上下文，讓對話過程更加連貫。

舉例來說，用戶可以輸入「幫這隻狗戴帽子，並把背景改成海灘」，Gemini 即會自動產出對應結果。甚至還可以模擬個人變裝風格，例如「換不同髮色的樣貌」、「把背景改成夜景城市」、「給人物加一副墨鏡」等等。

除了圖片修改，Google 也強調這項整合圖文的能力，可用於創作更有情境感的內容，例如撰寫附圖解的故事草稿、視覺化的步驟教學等。用戶可以請 Gemini 編寫關於「龍」的睡前故事，同時生成符合劇情的插圖。

為強化生成內容的辨識與透明性，Google 表示，所有透過原生圖像編輯功能產出的圖片都會嵌入不可見的 SynthID 數位浮水印，以利後續追溯圖像來源。同時也正在測試於圖像右下角顯示可見的「ai」標記，提醒使用者該圖片為 AI 生成。

這次圖像編輯功能的推出，延續 Google 先前在 AI Studio 推廣的 Flash 2.0 系統，其中強調其對文字與圖像的理解能力顯著提升，能夠生成更準確、語意一致的視覺內容。

目前此功能僅支援部分用戶，將於未來數週內擴大推出，預計將成為 Gemini 平台與 ChatGPT、Bing AI 等競爭的重要工具。