微軟 MAI-Image-2 生圖模型登場！不只畫得逼真，連文字也能精準呈現，Copilot 即將整合！

微軟在人工智慧生圖領域再次取得重大突破。微軟 AI 執行長穆斯塔法·蘇萊曼（Mustafa Suleyman）於 3 月 19 日在 X 平台宣布，正式推出第二代圖像生成模型 MAI-Image-2。這款新模型在具備高度公信力的 LMArena 圖像生成模型排行榜中表現亮眼，直接衝上全球第三名，展現出威脅 Google 與 OpenAI 領先地位的強大實力。

力壓群雄，直追 Google 與 OpenAI

LMArena（原名為 LMSYS Chatbot Arena）在 AI 業界被視為反映模型真實戰力的全球風向標，是各大科技巨頭展示技術實力的最高競技場。根據最新的排名顯示，MAI-Image-2 目前位居第三，僅次於 Google 的 gemini-3.1-flash-image-preview 以及 OpenAI 的 gpt-image-1.5-high-fidelity。

回顧微軟的發展歷程，這進步幅度堪稱驚人。微軟在 2025 年 10 月推出初代模型 MAI-Image-1 時，初始排名僅位列第九。雖然初代模型以生成速度快、避免內容重複為賣點，但在影像綜合品質上仍明顯落後於其他頂尖實驗室。而這次推出的第二代模型，憑藉著硬核的技術提升，完全扭轉了先前的劣勢。

精準還原光影，告別亂碼圖表

在實際表現上，MAI-Image-2 能夠精準還原自然的光影效果與真實膚色，並建構出極其逼真的物理環境。不過，最令業界驚艷的莫過於其文字渲染能力的顯著增強。

▲ 實測支援中文表現不錯

過去 AI 生圖最常被詬病的痛點，就是影像中的文字容易出現模糊或亂碼，導致無法製作精準的圖表。微軟研發團隊對此進行了深度優化，讓 MAI-Image-2 在處理包含文字的資訊圖表、簡報投影片以及複雜的邏輯圖表時顯得游刃有餘。對於有高難度創作需求的使用者，它也能輕鬆生成包含超現實概念、華麗構圖以及具有宏大世界觀的電影級超清影像。

目前，急於嘗鮮的使用者可以直接登錄 MAI Playground 平台進行免費體驗。微軟也表示，正逐步將 MAI-Image-2 整合至 Copilot 以及 Bing 影像建立者（Bing Image Creator）的底層架構中。待推送完成後，廣大的使用者就能在日常操作中直接調用這項強大的功能。

▲ 對於中文的呈現目前仍會有亂碼的問題