
過往在使用 AI 模型修圖時,由於整張圖皆會重新生成,因此在像是人物臉部部分常常都會變形扭曲,導致呈現效果不佳。而近日 Google 正式在 Gemini 應用程式中,釋出由 Google DeepMind 打造的全新圖片生成與編輯模型,主打不管是要換背景、服裝,甚至是融合兩張照片,樣貌都能保持「始終如一」。剛好筆者先前曾使用過舊模型進行修圖,今天我們就來實測看看在同樣的情境下,Gemini 新模型表現如何。
舊模型:人物足夠大時已能近乎完美重現
其實 Gemini 在尚未更新成新模型時,當圖片中的人物足夠大且清晰的情況下,修圖表現已經相當不錯。下方的組圖分別是上傳的原圖(左)、將衣服換成黑色(中)、將背景換為教室(右),可以看到 Gemini 當時已經可以很好地完成指令,除了指定要更改的部分外,其餘幾乎都有如實重現,要非常仔細看才能看出些微差異。(以下舊模型測試時間皆為 2025 年 7 月)
情境一:去除圖中雜物
不過當圖中人物較小或是本身就沒有那麼清晰時,Gemini 舊模型在圖片重現上就會有明顯瑕疵。像是筆者上傳了一張照片,下指定要求將左邊的人物去除時,舊模型雖然有確實地完成指令,不過人物臉部可以看到已經明顯換了樣子,五官還有點糊在一起,也少了一隻手,簡而言之就可以很輕易地在第一眼看出不合理之處。
換到了 Gemini 的新模型,可以看到在臉部處理相較於過去好上許多,雖然還不能說跟原圖一模一樣,但乍看之下有機會可以以假亂真。接著筆者又再下指令要求將背景換成海邊,在場景的處理上一樣是沒有問題,不過細看臉部又會與上一張略微不同。
情境二:換上指定衣服
接著是 AI 修圖剛出來時,很多人都說以後網購要看衣服是不是適合自己,不用再實際去試穿,可以直接請 AI 模擬,不過先前的合成效果其實可以說是不太具有參考價值。筆者先是上傳了兩張照篇,一張是由 AI 生成的穿著黑色衣服的女生(左上),另一張則是在 UNIQLO 官網上的綠色洋裝(左下),然後下指令,「合成兩張圖,讓穿著黑色衣服的女生,換成另一張圖的綠色裙子。」
Gemini 舊模型生成出來的結果(中),雖然有理解指令的意思,但不管是人物的臉部、動作,或是服裝的樣式,都跟原圖有明顯差異。而到了新模型,整體轉換效果相當完美,要雞蛋裡挑骨頭的話就是畫質不知道為什麼有點差。
情境三:合成兩張圖片
在一個人的情境下基本沒問題之後,我們再來試試能不能將兩個人合成到同一張圖片中。Gemini 舊模型(中)只能抓到原圖(左)很大概的輪廓,像是西裝、黃衣服、一男一女等元素,但無法生成出一樣的樣貌;新模型(右)在這方面的表現則是進步許多,整體人物一致性維持相當不錯,甚至女生黃衣服上的蕾絲也有還原。
情境四:變換不同髮型
最後,由於 Google Gemini App 在官方的 X 上發布了一則推文,「你會換個新髮型嗎?現在嘗試新髮型比以往任何時候都容易。」並配了張一個女性換了各式髮型的樣子,臉部基本都沒有變型,因此我們也決定來實測實際使用上效果如何。
由左至右分別是 Gemini 從原圖更改第一次髮型,接著直接在同一個聊天室中接續下指令,要求再換一個髮型。可以看到臉部還是沒有辦法完全保持一致,每一次的生成都還是會有些細微的變化,換到最後可能就會跟原始樣子越差越大。所以如果真的想要用 AI 來試看看不同髮型的效果,建議每個髮型可以重開一個新的聊天室,呈現出來的樣子可能較具參考價值。
Gemini 圖像編輯模型的功能目前已在 Gemini App 全面開放,免費與付費用戶都能玩,有興趣的讀者很推薦自己去實際使用看看效果!
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!