
Google 先前宣布,Gemini 圖片編輯功能全面升級為 Gemini 2.5 Flash Image。新版本模型在角色一致性、精準的對話式編輯,以及將多張照片組合創造新圖像等方面,都有顯著進步,甚至在盲測階段就已經在網路上引發熱烈討論。為了讓使用者能更好發揮這次升級的優勢,Google 官方也整理了一些撰寫有效提示的技巧。
文章目錄
Gemini 圖像生成的核心能力
在正式開始之前,我們先來了解一下最新的 Gemini 模型的改進之處,以便思考可以嘗試哪些應用:
- 角色設計一致性:在多輪生成與編輯中,保持角色或物件外觀一致。
- 創意構圖:能將不同元素、主體和風格融合成統一的圖像。
- 局部編輯:可用簡單的語言,對圖像特定區域進行精準修改。
- 設計與外觀應用:能將某個概念的風格、紋理或設計套用到另一個概念上。
- 邏輯與推理:具備理解現實世界關係的能力,可生成複雜場景或預測下一步發展。
撰寫有效提示的 6 個要素
雖然輸入簡單描述,如「一隻在草原上奔跑的狗」,Gemini 仍能生成不錯的結果,但若希望更貼近想像畫面,或想控制更多細節,建議在提示中包含以下六個要素:
- 主體:圖像中的核心角色或物件是誰?例:一個有發光藍色光學眼的冷面機器人咖啡師;一隻戴著小巫師帽的毛茸茸三花貓。
- 構圖:鏡頭取景角度與視覺呈現方式。例:特寫、廣角、低角度拍攝、肖像。
- 動作:場景中正在發生什麼事?例:沖咖啡、施展魔法、在田野中奔跑。
- 地點:情境發生的環境與背景例:火星上的未來咖啡館、雜亂的煉金術士圖書館、黃金時段陽光灑落的草地。
- 風格:整體美學與視覺風格。例:3D 動畫、黑色電影、水彩畫、寫實攝影、1990 年代產品攝影。
- 編輯指示:若修改現有圖像,需直接且明確描述。例:把男人的領帶換成綠色、移除背景中的汽車。
5 大提示策略與範例參考
不同的提示策略可以解鎖從寫實編輯到奇幻新世界的一切可能。以下是 Google 提供 5 個可以嘗試的技巧,每個技巧也都附帶了一個範例。
1. 保持角色外觀一致
Gemini 能在不同姿勢、光線與場景下,維持角色的核心特徵,甚至能為同一角色套用新風格:
- 提示 1:一幅古靈精怪的插畫,描繪一個發光的小蘑菇精靈。精靈頭戴一個巨大的生物發光蘑菇帽,有著大而好奇的眼睛,身體由編織的藤蔓構成。
- 提示 2(在同一個對話中):現在,讓同一個精靈騎在一隻友善、長滿青苔的蝸牛背上,穿過一個充滿五顏六色野花的陽光草地。
透過在第一個提示中,用具體的細節建立一個清晰的角色,就可以在後續的提示中,將同一個角色放置在全新的情境中。在這裡,Gemini 會保留角色的關鍵特徵,如臉部特徵、獨特的外觀和服裝。
2. 精確地進行局部轉換
更新後的編輯功能能快速且準確地修改圖片中的特定元素,適用於產品展示或個人照片優化等情境:
- 提示 1:一張高品質照片,描繪一個現代、簡約的客廳,配有灰色沙發、淺色木質咖啡桌和一盆大型盆栽。
- 提示 2(編輯):將沙發的顏色改成深海軍藍。
- 提示 3(編輯):現在,在咖啡桌上疊放三本書。
這展示了 Gemini 在局部編輯方面的實力。透過使用直接、對話式的指令,就可以修改圖像中的特定元素,而無需複雜的軟體或重新生成整個場景。
3. 透過創意構圖融合概念
Gemini 能將多個概念整合為單一圖像,創造出獨特視覺效果:
- 提示 1:生成一張戴著頭盔並穿著全套太空服的太空人的寫實照片。
- 提示 2:一張長滿植物的熱帶雨林籃球場照片。
- 提示 3(上傳兩張並結合):讓太空人在這個籃球場上灌籃。
4. 應用和適應新風格
透過風格轉換,Gemini 能保留主體形態,同時為圖像重新渲染不同的藝術氛圍:
- 提示 1:一張停在城市街道上的經典摩托車寫實圖像。
- 提示 2(編輯):將這張圖像套用建築繪圖的風格。
透過「風格轉換」,Gemini 能理解核心主體(摩托車)及其形態,然後以所要求的藝術風格完全重新渲染它。這種方法非常適合用於設計靈感、藝術創作或視覺探索。
5. 利用邏輯和推理進行複雜生成
Gemini 能理解現實世界邏輯,並根據上下文預測後續情節:
- 提示 1:生成一張一個人站著,手裡拿著一個三層蛋糕的圖像。
- 提示 2(在同一個對話中):生成一張他絆倒後會發生什麼事的圖像。
模型會根據第一張圖像的狀態,模擬蛋糕掉落的合理結果,生成動態且連貫的新畫面。
現階段仍存在使用限制
雖然 Gemini 2.5 被許多人稱為「修圖神器」,甚至有人認為未來可能取代 Photoshop 等專業軟體,但 Google 也提醒,這項技術目前仍存在一些限制。角色一致性雖然比過去進步許多,但多次編修後仍有可能出現角色外觀逐漸失真的情況。
此外,模型在文字渲染方面仍不算完美,偶爾會拼錯單字,或在面對複雜排版時出現錯誤。風格生成方面,由於 AI 本身具有隨機性,有時可能會產生與預期不符的結果,而在長寬比控制上,即使輸入了明確的尺寸要求,最終生成的結果也未必總能精準符合設定。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!