FB 建議貼文

選取貼文複製成功(包含文章連結)!

OpenAI 奪回 AI 繪圖王者寶座!GPT Image 2「原生思考」架構超越 Nano Banana

OpenAI 奪回 AI 繪圖王者寶座!GPT Image 2「原生思考」架構超越 Nano Banana

AI 繪圖界在 2026 年 4 月迎來了歷史性的轉折。OpenAI 正式發布 GPT Image 2,在權威榜單 LM Arena 中以領先第二名 241 分的誇張差距登頂。這項突破被執行長奧特曼稱為「跨代升級」,等同於從 GPT-3 到 GPT-5 的質變。更具象徵意義的是,OpenAI 成功反擊了 Google 之前靠著「Nano Banana」系列建立的短期優勢,重新定義了圖像生成 AI 的技術規格。

OpenAI 奪回 AI 繪圖王者寶座!GPT Image 2「原生思考」架構超越 Nano Banana

GPT Image 2 之所以能展現如此強大的壓制力,關鍵在於其「原生思考(Native Thinking)」架構。

OpenAI 奪回 AI 繪圖王者寶座!GPT Image 2「原生思考」架構超越 Nano Banana

與傳統 Stable Diffusion 類型的擴散模型不同,GPT Image 2 並非單純地根據提示詞「畫圖」,而是像人類畫師一樣,會先對畫面結構進行逻辑思考、繪製草圖、自行審核修正,甚至在必要時主動搜尋網路資料補充細節。OpenAI 研究負責人 Boyuan Chen 表示,這是一個「從零重構」的通用模型,其本質更像是一個會畫圖的 GPT,而非單純的圖像生成器。

文字生成與立體感呈現的指數級躍升

在實測中,GPT Image 2 在最難攻克的「文字渲染(Text Rendering)」專案上表現驚人。傳統模型對圖像中的文字往往會產生亂碼,但 GPT Image 2 的準確率達到了 99%,甚至能在一粒米上精確畫出可辨識的微型文字。在 3D 透視與動漫風格的細節呈現上,新模型相比前代有著近 3 倍的效能提升。OpenAI 總裁 Greg Brockman 在 X 上展示的「照片修復」範例,更證實了該模型對高保真圖像輸入的精確解析與重構能力。

OpenAI 奪回 AI 繪圖王者寶座!GPT Image 2「原生思考」架構超越 Nano Banana

隨著 GPT Image 2 上線,數位內容產業的成本結構正被重新洗牌。OpenAI 公布的高品質產出 API 定價僅為每張 0.21 美金,這對於 Figma、Adobe 與 Canva 等設計工具商來說,無疑是極大的競爭壓力。分析師預測,這種高品質且低成本的產出能力,將在 2026 年下半年引發圖像產業的大規模重組,傳統的商業攝影與平面設計流程將面臨被 AI 深度滲透甚至取代的風險。

OpenAI 奪回 AI 繪圖王者寶座!GPT Image 2「原生思考」架構超越 Nano Banana

GPT Image 2 的出現,宣告了「畫得像」的時代結束,「會思考」的時代正式開啟。當 AI 不再只是被動地接收指令,而是能主動理解圖像內部的結構與邏輯時,繪圖工具已轉化為真正的「數位勞動力」。這不只是 OpenAI 贏了 Google 一局,而是整個人工智慧賽道的一次範式轉移。未來,圖像不再只是裝飾,而是語意的延伸與表達,而我們正站在這個新紀元的起跑線上。

 

 

IFENG
作者

鳳凰網(科技),集綜合資訊、視訊分發、原創內容製作、網路廣播、網路直播、媒體電商等多領域於一身,並於2011年在紐交所上市(紐交所代碼:FENG),成為全球首個從傳統媒體分拆上市的新媒體公司。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則