微軟在人工智慧生圖領域再次取得重大突破。微軟 AI 執行長穆斯塔法·蘇萊曼(Mustafa Suleyman)於 3 月 19 日在 X 平台宣布,正式推出第二代圖像生成模型 MAI-Image-2。這款新模型在具備高度公信力的 LMArena 圖像生成模型排行榜中表現亮眼,直接衝上全球第三名,展現出威脅 Google 與 OpenAI 領先地位的強大實力。
力壓群雄,直追 Google 與 OpenAI
LMArena(原名為 LMSYS Chatbot Arena)在 AI 業界被視為反映模型真實戰力的全球風向標,是各大科技巨頭展示技術實力的最高競技場。根據最新的排名顯示,MAI-Image-2 目前位居第三,僅次於 Google 的 gemini-3.1-flash-image-preview 以及 OpenAI 的 gpt-image-1.5-high-fidelity。

回顧微軟的發展歷程,這進步幅度堪稱驚人。微軟在 2025 年 10 月推出初代模型 MAI-Image-1 時,初始排名僅位列第九。雖然初代模型以生成速度快、避免內容重複為賣點,但在影像綜合品質上仍明顯落後於其他頂尖實驗室。而這次推出的第二代模型,憑藉著硬核的技術提升,完全扭轉了先前的劣勢。
精準還原光影,告別亂碼圖表
在實際表現上,MAI-Image-2 能夠精準還原自然的光影效果與真實膚色,並建構出極其逼真的物理環境。不過,最令業界驚艷的莫過於其文字渲染能力的顯著增強。

過去 AI 生圖最常被詬病的痛點,就是影像中的文字容易出現模糊或亂碼,導致無法製作精準的圖表。微軟研發團隊對此進行了深度優化,讓 MAI-Image-2 在處理包含文字的資訊圖表、簡報投影片以及複雜的邏輯圖表時顯得游刃有餘。對於有高難度創作需求的使用者,它也能輕鬆生成包含超現實概念、華麗構圖以及具有宏大世界觀的電影級超清影像。


目前,急於嘗鮮的使用者可以直接登錄 MAI Playground 平台進行免費體驗。微軟也表示,正逐步將 MAI-Image-2 整合至 Copilot 以及 Bing 影像建立者(Bing Image Creator)的底層架構中。待推送完成後,廣大的使用者就能在日常操作中直接調用這項強大的功能。

微軟這次的表現確實讓人眼睛一亮。過去大眾普遍認為生圖領域是 Midjourney 或 OpenAI 的天下,微軟的模型往往被貼上速度快但品質普通的標籤。
然而,MAI-Image-2 解決了 AI 繪圖中最難攻克的文字精準度問題,這對於商務簡報與專業繪圖領域來說,無疑是一大福音。隨著這項技術全面導入 Copilot,微軟在 AI 應用端的競爭力將會再次大幅提升。
- 延伸閱讀:Google 推出 Nano Banana Pro:圖像生成編輯一條龍,構圖光線精準控制,中文字生成障礙也克服了!
- 延伸閱讀:AI 繪圖大比拼:ChatGPT、Gemini、Grok 三大平台圖像生成能力全面評測
- 延伸閱讀:AMD發表世界首款BF16模型,筆電NPU就能跑SD 3.0 Medium圖像生成模型
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!