OpenAI 發表全新影像生成模型 ChatGPT Images 2.0,將 AI 生成圖片從「渲染工具」推進至具備策略思考能力的「視覺設計系統」。ChatGPT Images 2.0 主打更精準的指令理解與細節還原能力,能正確擺放與關聯畫面物件,並支援等高難度內容生成;同時提升多語系表現,實測繁體中文也完全沒問題。

跨語言能力更強
相較一年前推出的 ChatGPT Images,2.0 版本在多項核心能力上出現顯著躍進。首先是在指令理解與細節還原方面,模型能更精準地擺放與關聯畫面中的物件,並處理過去較容易失真的元素,例如小字、圖示、UI 元件與複雜構圖。官方表示,生成結果不再只是「接近需求」,而是能直接投入使用的視覺內容,API 最高支援 2K 解析度輸出。
在語言能力上,Images 2.0 也大幅強化多語系表現,特別是在日文、韓文、中文、印地文與孟加拉文等非拉丁語系文字的生成準確度明顯提升。不僅能正確顯示文字,還能讓語言自然融入畫面設計,應用於海報、教學圖解與漫畫等內容,使影像創作更具全球適用性。


直向、橫向自由調整
風格與真實感方面,新模型能更準確捕捉不同視覺語言的特徵,無論是寫實攝影、電影畫面、像素風或漫畫風格,都能在光影、材質與構圖上呈現更高一致性。這讓其在遊戲開發、分鏡設計與行銷素材製作等場景更具實用價值。



此外,Images 2.0 支援更彈性的輸出比例,從橫向 3:1 到直向 1:3,能直接對應簡報、橫幅、社群貼文或手機畫面等不同使用情境。模型也整合截至 2025 年 12 月的世界知識,在製作教學圖表與資訊視覺化內容時,能兼顧美感與正確性。
思考與推理能力
一大亮點是導入「思考(thinking)」能力。當使用者選擇推理模型時,Images 2.0 可進行更深入的任務理解,甚至透過網路搜尋即時資訊,協助完成從構想到成品的完整流程。模型也能一次生成最多 8 張具備一致角色與物件設定的圖像,支援漫畫分鏡、空間設計提案或多版本視覺方案等過去較繁瑣的工作流程。

免費用戶也可以玩
在應用層面,該功能已整合至 ChatGPT、Codex 與 API。開發者可透過 gpt-image-2 將影像生成能力導入產品,應用於在地化廣告、資訊圖表、教育內容與設計工具等場景,提升實際商業價值。
不過 OpenAI 也坦言,模型仍存在限制。例如在需要高度精確物理結構的任務(如摺紙教學、魔術方塊)或極度細密、重複的圖像細節上,仍可能出現誤差;部分標註與圖解內容也仍需人工檢查。
ChatGPT Images 2.0 已正式向所有 ChatGPT 與 Codex 使用者開放,免費版也可以用,一天額度約三到五張;其中進階的「思考」功能則提供給 Plus、Pro 與 Business 訂閱用戶。API 版本 gpt-image-2 也已上線,價格依輸出品質與解析度而有所不同。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!