微軟 AI 圖像生成大躍進！MAI-Image-2.5 空降排行榜第三，直追 OpenAI！

微軟近日發布其最新一代文字生成圖像模型 MAI-Image-2.5，並在 Arena 的最新文生圖排行榜中首發即拿下第三名的位置，顯示其在 AI 圖像生成領域的整體實力正明顯追趕行業領先者。

目前在這一榜單上，OpenAI 的 gpt-image-2 以 1388 分位居第一。微軟表示，MAI-Image-2.5 在多種圖像風格上的表現全面提升，能夠更好地貼合用戶提示生成圖像，並在文字渲染與畫面細節方面有顯著改進。

微軟最初於去年推出自研圖像生成模型 MAI-Image-1，當時在 Arena 的 Image Arena 排名中僅位列第 9 名，與其他實驗室的頂級模型存在明顯差距，隨後整合至 Bing.com/create 以及 Bing 手機應用中向用戶開放。

今年 3 月，微軟 AI 團隊發布第二代 MAI-Image-2，在自然光表現、膚色還原等方面帶來明顯提升，首次闖入 Arena 排行榜前三，僅落後於 Google 的 gemini-3.1-flash-image-preview 和 OpenAI 的 gpt-image-1.5-high-fidelity，並同步接入 Copilot、Bing Image Creator 和 Microsoft Foundry API 供開發者調用。

強化視覺推理與商業應用

在此基礎上，新一代 MAI-Image-2.5 進一步強化了模型整體能力。微軟介紹稱，新模型能更精確地理解和執行用戶的文字提示，生成的圖像在細節和整體結構上更加連貫，且在文字內容的繪製上更加可靠。該模型的視覺推理能力也有所增強，對物體、光照、比例、場景結構以及空間關係的理解更加準確，有助於生成更符合真實場景和用戶預期的畫面。

微軟特別強調，MAI-Image-2.5 在文字渲染、風格化插畫以及商業類圖像上的進步最為明顯，包括海報、包裝打樣、品牌創意和產品圖等場景，都能產生更高品質的輸出。相比前代模型，新模型生成圖像中的文字更加清晰銳利，版式布局更加穩定，品牌視覺元素也更突出、更具整體質感，更契合商業設計和行銷應用需求。

微軟 AI 負責人 Mustafa Suleyman 表示，MAI-Image-2.5 登上 Arena 文生圖排行榜第三名，標誌著圖像生成品質又迎來一次重要躍遷，並預告在即將到來的 Build 大會上，微軟 AI 團隊還將帶來更多相關更新與發布。他稱這只是微軟在 AI 圖像領域發力的又一步，後續還會持續推進模型能力和產品形態更新。

目前，MAI-Image-2.5 已透過 Arena 面向所有用戶開放試用，用戶可以直接在該平台上與其他模型進行對比體驗。按照微軟的計畫，這一新模型也將在未來兩週內陸續登陸 MAI Playground 和 Microsoft Foundry，為普通用戶與開發者提供更多樣化的生成式圖像創作與整合選項。