FB 建議貼文

選取貼文複製成功(包含文章連結)!

微軟AI圖像生成大躍進!MAI-Image-2.5空降排行榜第三,直追OpenAI!

微軟AI圖像生成大躍進!MAI-Image-2.5空降排行榜第三,直追OpenAI!

微軟近日發布其最新一代文字生成圖像模型 MAI-Image-2.5,並在 Arena 的最新文生圖排行榜中首發即拿下第三名的位置,顯示其在 AI 圖像生成領域的整體實力正明顯追趕行業領先者。

目前在這一榜單上,OpenAI 的 gpt-image-2 以 1388 分位居第一。微軟表示,MAI-Image-2.5 在多種圖像風格上的表現全面提升,能夠更好地貼合用戶提示生成圖像,並在文字渲染與畫面細節方面有顯著改進。

微軟最初於去年推出自研圖像生成模型 MAI-Image-1,當時在 Arena 的 Image Arena 排名中僅位列第 9 名,與其他實驗室的頂級模型存在明顯差距,隨後整合至 Bing.com/create 以及 Bing 手機應用中向用戶開放。

微軟AI圖像生成大躍進!MAI-Image-2.5空降排行榜第三,直追OpenAI!

今年 3 月,微軟 AI 團隊發布第二代 MAI-Image-2,在自然光表現、膚色還原等方面帶來明顯提升,首次闖入 Arena 排行榜前三,僅落後於 Google 的 gemini-3.1-flash-image-preview 和 OpenAI 的 gpt-image-1.5-high-fidelity,並同步接入 Copilot、Bing Image Creator 和 Microsoft Foundry API 供開發者調用。

強化視覺推理與商業應用

在此基礎上,新一代 MAI-Image-2.5 進一步強化了模型整體能力。微軟介紹稱,新模型能更精確地理解和執行用戶的文字提示,生成的圖像在細節和整體結構上更加連貫,且在文字內容的繪製上更加可靠。該模型的視覺推理能力也有所增強,對物體、光照、比例、場景結構以及空間關係的理解更加準確,有助於生成更符合真實場景和用戶預期的畫面。

微軟AI圖像生成大躍進!MAI-Image-2.5空降排行榜第三,直追OpenAI!

微軟特別強調,MAI-Image-2.5 在文字渲染、風格化插畫以及商業類圖像上的進步最為明顯,包括海報、包裝打樣、品牌創意和產品圖等場景,都能產生更高品質的輸出。相比前代模型,新模型生成圖像中的文字更加清晰銳利,版式布局更加穩定,品牌視覺元素也更突出、更具整體質感,更契合商業設計和行銷應用需求。

微軟 AI 負責人 Mustafa Suleyman 表示,MAI-Image-2.5 登上 Arena 文生圖排行榜第三名,標誌著圖像生成品質又迎來一次重要躍遷,並預告在即將到來的 Build 大會上,微軟 AI 團隊還將帶來更多相關更新與發布。他稱這只是微軟在 AI 圖像領域發力的又一步,後續還會持續推進模型能力和產品形態更新。

目前,MAI-Image-2.5 已透過 Arena 面向所有用戶開放試用,用戶可以直接在該平台上與其他模型進行對比體驗。按照微軟的計畫,這一新模型也將在未來兩週內陸續登陸 MAI Playground 和 Microsoft Foundry,為普通用戶與開發者提供更多樣化的生成式圖像創作與整合選項。



 

 

cnBeta
作者

cnBeta.COM(被網友簡稱為CB、cβ),官方自我定位「中文業界資訊站」,是一個提供IT相關新聞資訊、技術文章和評論的中文網站。其主要特色為遊客的匿名評論及線上互動,形成獨特的社群文化。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則