AI 生圖圈原本看似已由 Nano Banana 穩坐霸主地位,但沉寂多時的 OpenAI 突然帶著 ChatGPT Images 2.0 回歸。新模型無論是在中文字處理、排版能力,還是角色外觀一致性等,都有明顯躍進,社群平台上也迅速湧現大量相關作品。那麼 ChatGPT Images 2.0 究竟厲害在哪裡?有哪些限制?又最適合生成哪類型的圖片?本文將一次帶你深入了解,並精選網路上熱門的指令供參考。
文章目錄
ChatGPT 生圖模型大進化
時隔一年,OpenAI 推出新一代影像生成模型「ChatGPT Images 2.0」,主打更精準的指令理解、更強的多語言能力,以及具備推理能力的 AI 生圖體驗。官方表示,新模型不只是生成圖片,更朝向「視覺設計系統」發展,可協助完成海報、圖解、UI 設計與行銷素材等實際應用。在 API 中最高還支援 2K 解析度輸出,不過現階段處於 Beta 版,在部分情況下可能會出現不穩定結果。
具思考能力的圖像模型
過去 AI 在生圖時,容易出現文字錯誤、物件擺放不自然與細節失真等問題,升級後的 ChatGPT Images 2.0 不僅能更準確理解複雜指令,包含小字、圖示與 UI 元件等內容都能有更高完成度;同時也強化中文、日文、韓文等非拉丁語系文字生成能力,不只文字正確率提升,排版與語句流暢度也更自然,適合用於海報、漫畫與教學圖解。在風格表現上,Images 2.0 可更穩定呈現寫實攝影、電影感、像素風與漫畫等不同風格,並支援 3:1 到 1:3 等多種圖片比例,方便套用於社群、簡報與手機畫面。
此外,這也是 OpenAI 首款具備「thinking」能力的圖片模型,搭配推理模型使用時,可搜尋最新資訊、規劃畫面結構,甚至一次生成最多 8 張具連續性的圖片。

限制:複雜結構仍可能出錯
不過,OpenAI 也表示,雖然 Images 2.0 已有大幅進步,但仍存在部分限制。例如在需要高度精確空間理解的任務上,像是摺紙教學、魔術方塊、複雜結構示意圖等,模型仍可能出現錯誤。另外,涉及大量重複細節的場景,例如沙粒、密集紋理與極複雜圖樣,也可能影響生成品質。官方也提醒,帶有箭頭、標籤與部件說明的圖解內容,建議人工再次確認正確性。

中文字不再變亂碼,實用度更高
首先對一般使用者來說,這次最有感的更新之一,就是 AI 生圖終於更完整支援繁體中文。再加上模型具備更強的視覺理解與世界知識,現在只要透過簡單提示詞,就能生成完成度更高、甚至可直接使用的圖片,不再只是設計草稿,後續還得自己重新排版製圖。
多語言、手寫字都能生成
先前 AI 生圖在文字表現上,多半只有英文較穩定,如果想要生成中文,就容易產生亂碼、錯字,因此不少人在下提示詞時,甚至會特別要求「不要文字」。但在 ChatGPT Images 2.0 上,這類問題已有明顯改善,大幅提升非拉丁文字的呈現品質,在日文、韓文、中文、印地文與孟加拉文等語言上尤為顯著,甚至要讓一張圖片同時呈現跨語言內容也可以。
在字體風格方面,AI 會依照圖片風格自動搭配適合字體。但如果想指定風格,也能直接透過提示詞描述,例如印刷體、手寫字效果或電影劇照風格等;不過無法像文書軟體一樣,直接指定特定字體檔案。

排版、海報生成更實用
除了文字能力提升外,Images 2.0 也展現了更強的構圖感與視覺品味。對一般使用者來說,大部分人未必具備美編或設計背景,但工作上偶爾還是會遇到需要製作海報、活動宣傳圖或社群貼文的需求。現在只要提供必要資訊,例如「幫我做一張講座海報」或「設計餐廳宣傳圖」,即使提示詞簡單,AI 也能自動完成排版、安排圖片與文字位置,快速生成具備一定完成度的設計內容。
不過要注意的是,雖然整體品質已經提升不少,但偶爾還是可能出現怪字、錯字或排版細節問題。如果是要正式對外使用的內容,建議生成後還是再檢查一次。


精準鎖定特徵的外觀一致性
再來測試的重點,則是 AI 生圖一直以來最容易翻車的「外觀一致性」。不少人會利用 AI 進行修圖,或是希望維持同一人物與畫面,再轉換成不同風格。不過由於 AI 生圖本質上是「重新生成」圖片,因此過去常出現五官跑掉、神韻改變,甚至每張都像不同人的情況。因此我們就來實際測試 ChatGPT Images 2.0 在維持人物特徵與畫面一致性上的表現。
製作雜誌封面與內頁
筆者上傳了兩期 PC home 雜誌的封面與內頁,再搭配一張自己的照片,要求 AI 將自己變成封面人物。可以看到,AI 不僅成功還原人物樣貌,連雜誌風格、版面與視覺感也模仿得相當到位。
不過在製作內頁時,第一次下指令要求「維持人物,但更換動作與服裝」,生成結果雖然成功保留長相,但表情幾乎完全相同,看起來略顯不自然。之後再追加「更換表情」指令後,成功改變了表情,人物神韻與五官卻開始出現些微偏移。因此如果希望保留人物一致性,又想更換表情,建議直接提供參考表情圖片,效果通常會更穩定。



連續改圖實測:換穿搭、背景
接著再利用服飾穿搭測試連續改圖表現。實測發現,如果只是更換背景或局部調整,人物幾乎可以完整維持原本模樣。
但如果改動幅度較大,例如從半身改成全身、重新生成整套穿搭,或是大幅變更構圖時,人物長相就會出現一些細微變化。雖然整體一致性已比過去提升不少,但在大幅修改畫面時,還是難免會有些「重新生成」的感覺。


支援橫向 3:1 到直向 1:3 的靈活長寬比
另一項更新重點,則是開始支援從橫向 3:1 到直向 1:3 的多種長寬比,讓 AI 生圖能更直接對應不同使用場景。像是常見的 16:9 可用於簡報、影片封面與橫幅設計;9:16 則是目前手機與短影音平台常見比例,適合用來製作限時動態、Reels 或 Shorts 等社群內容。現在只要在提示詞中指定比例,就能直接生成對應格式的圖片,省去後續裁切與重新排版的時間。
以下也實際測試較極端的 3:1 與 1:3 長條比例,看看適合應用在哪些場景。
橫式:流程圖、網頁 Banner
較長的橫式比例,很適合拿來製作流程圖、時間軸或資訊整理圖等。像是步驟教學、活動流程與產品介紹等內容,都能透過長畫面一次呈現。
另外,如果有在經營網站或社群,也能直接利用 AI 快速生成 Banner 圖。未來如果活動主題或檔期更新,只要重新下提示詞,就能快速產出新版本,不需要再從頭重新設計。

直式:書籤、長條漫畫
直式長圖則可用於像是書籤、網頁側邊欄設計,或是近年相當常見的長條漫畫形式。由於現在多數內容都以手機閱讀為主,長條式設計能讓使用者透過滑動方式持續閱讀,也更符合目前社群與數位內容的瀏覽習慣。
實測下來, 即使是較極端的長條比例,ChatGPT Images 2.0 依舊維持不錯的構圖與排版完整度,不會出現畫面被硬拉長或內容失衡的情況。

進階功能:會思考、還能連續生成
除了基礎生圖能力外,ChatGPT Images 2.0 也加入部分進階功能,像是可切換至「thinking」模式、自行上網搜尋資料,以及支援一次生成多張具連續性的圖片。這些功能目前主要開放給 ChatGPT Plus、Pro 與 Business 用戶使用。
Thinking 模式生圖前會先思考
當切換至 thinking 模式後,模型會花更多時間理解需求,並在生成圖片前進行額外推理與分析。OpenAI 表示,這時 AI 不只是單純「生成圖片」,而是更像一位能協助規劃與整理視覺內容的工具。例如模型可以先搜尋最新資訊、整理重點,再根據內容自動安排畫面結構、版面與資訊呈現方式。對於教學圖解、資訊整理、簡報素材或需要較高正確性的內容會特別有幫助。
此外,thinking 模式也更重視畫面一致性與細節控制,像是角色連續性、構圖邏輯與風格統一等,都會比一般模式更加穩定。
一次可生成最多 8 張圖片
另一項進階功能,則是支援一次生成多張具關聯性的圖片。過去如果想製作漫畫分鏡、系列海報,或同一角色的不同畫面,通常需要一張一張慢慢生成,再自行挑選與調整。現在透過 thinking 模式,ChatGPT Images 2.0 最多可一次生成 8 張互相關聯的圖片,並維持角色、物件與整體風格的一致性。
這類功能特別適合用於漫畫、故事分鏡、社群素材、室內設計提案或多版本視覺概念發想等場景,讓使用者不需要反覆下大量提示詞,就能快速完成一整組視覺內容;且同一次生成時,也能同時提供多種圖片比例。因此比方說同樣的內容要發布到不同平台,使用者就不需要再自行重新排版,AI 將會維持整體視覺一致性,並依照不同長寬比自動調整排版。
提示詞:
我要開一間關東煮店,是屋台型的日式餐車,幫我製作宣傳海報。圖片裡需包含一張熱氣騰騰、色彩豐富的關東煮圖片,極簡風格,並提供多種寬高比的文件,以便我可以將其用於網站、Banner、Instagram Stories、Instagram 主頁。
10 大社群熱門提示詞整理
應用 1:LINE 貼圖
提示詞:請依照提供的人物形象設計一組 16 張風格一致的專屬似顏繪貼圖。採用可愛精緻的 Q 版風格(chibi),在保留人物五官特色與辨識度的同時,賦予其豐富的情緒與生動自然的動作,也可搭配飲料、美食、愛心、可愛符號及各類手勢等生活日常情境元素。保持色彩乾淨、柔和且具設計感,16 張貼圖的角色比例一致,可點綴簡短的中英文文字以提升實用性與互動感。最終將呈現一套完整排列的 16 張貼圖,每張皆為高解析度,既可獨立使用也適合整體輸出。

應用 2:手繪註解塗鴉
提示詞:根據上傳的照片,自動觀察畫面中的所有可見元素,生成一張具有「手繪註解塗鴉」風格的影像。系統需自動辨識照片中的食物、飲料、器皿、桌面、背景、光影與環境,並直接依照畫面內容,使用白色或米白色細線條進行手繪描邊,線條需呈現「隨手畫」的自然質感,略微抖動、不完美。請沿著壽司、盤子、桌面等主要物體外輪廓畫描邊,並適度加入箭頭、虛線、圈選以引導視線,整體筆觸應保持輕盈不複雜。註解需使用手寫感繁體中文,字體需像日記塗鴉般略微歪斜、不工整但可讀性高,每句話需簡短(5∼12 字內),語氣自然、帶有情緒與生活感。整體呈現風格應如同 Instagram 限時動態手寫塗鴉、生活 Vlog 隨手記錄或是雜誌邊角的靈感筆記。

應用 3:小畫家醜圖風
提示詞:(使用英文提示詞效果較佳)Redraw the attached image in the most clumsy, scribbly, and utterly pathetic way possible. Use same color, and make it look like it was drawn in MS Paint with a mouse. It should be vaguely similar but also not really, kind of matching but also off in a confusing, awkward way, with that low-quality pixel-by-pixel feel that really emphasizes how ridiculously bad it is. Actually, you know what, whatever, just draw it however you want.

應用 4:角色三視圖
提示詞:一個專業的角色概念設計設定集,主角是一位金髮藍瞳的年輕女巫,整體風格帶有《哈利波特》與暗黑學院風的美學。她身穿經典且優雅的深色巫師學院長袍、復古針織毛衣與合身的學院風制服。乾淨的白色背景,整齊的網格排版,高解析度。
設定集包含:全身三視圖旋轉(正面、側面、背面)、四種面部表情研究(自然、微笑、憤怒、驚訝)、復古魔杖與學院徽章部件的詳細放大分解圖。底部有一行整齊的色板色樣,並帶有優雅排版的簡短世界觀註記。整體風格電影感概念藝術,溫暖的復古光影,16:9 長寬比,高解析度。

應用 5:ChatGPT 想像中的我
提示詞:(附一張你的照片)生成一張你想像中的「我」的插圖、日系插畫風、角色特徵鮮明、情緒自然表情、半身構圖、動態姿態、服裝細節精緻、手繪塗鴉風、潑墨筆觸、隨性線條、粉彩與墨色混合、漫畫草稿質感、白色簡約背景、周圍符號化元素點綴、氛圍感強、高細節、高品質。

應用 6:髮型分析
提示詞:請根據我上傳的人像照片,製作一張高質感個人髮型分析圖卡。保留主角原本五官、臉型與真實特徵,透過對比方式展示不同髮型,清楚區分「最適合」、「普通」與「不建議」,可比較長短髮、瀏海、捲髮等,版面設計需乾淨時尚、像專業顧問報告。

應用 7:色彩鑑定
提示詞:根據上傳的人像照片,製作一張高質感個人色彩分析圖卡。請保留主角五官、膚色、臉型與真實特徵,透過左右或並排對比方式,展示不同服裝顏色穿在主角身上的效果,清楚區分「適合色」與「不適合色」,讓人一眼看出哪些顏色最襯膚色、提升氣色與整體質感。版面設計需乾淨時尚、像專業形象顧問報告,整體以視覺呈現為主,使用簡短標籤(如:推薦、普通、避免),不要加入長段文字。

應用 8:分析五官長相
提示詞:根據這張照片建立一個乾淨、簡約、高階的面部美容報告。使用黑白設計,線條細,圓潤的卡片和奢華的美學。包括臉部的簡單輪廓線圖、誠實的吸引力分析(對稱性、比例、骨骼結構、面部等)、清晰的分數、優勢、需要改進的領域以及可操作的美容/風格建議。保持資料驅動,視覺上精緻,不要過於討人喜歡。

應用 9:社群截圖評論
提示詞:將社群帳號截圖製作成紙張列印效果,畫面帶輕微陰影與紙張紋理。使用紅色原子筆手寫風格,在圖片上加入大量中文吐槽批註與塗鴉。包含箭頭、圈選、底線、放大重點、驚嘆號、問號、情緒表情(無語、翻白眼、問號臉)。風格像朋友或老師在旁邊邊看邊吐槽,語氣幽默、誇張、帶一點毒但不惡意攻擊。畫面稍亂但有重點,像隨手亂畫但其實很好笑的那種。

應用 10:電影海報
提示詞:根據你對我的了解,如果我成為電影女主角會是什麼樣的電影?跟哪些人共演?請根據我上傳的照片生成一張電影預告海報。

本文同步刊載於 PC home 雜誌

歡迎加入 PC home 雜誌粉絲團!
- 延伸閱讀:ChatGPT Images 2.0 登場:具「思考能力」的 AI 圖像模型,繁體中文、排版全都沒問題
- 延伸閱讀:免費版 Midjourney 替代方案?Meta AI 生圖功能超強大!網頁版進階設定一次看!
- 延伸閱讀:Intel Lunar Lake 與 Meteor Lake 比一比,AI 生圖更快、功耗更低
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!