FB 建議貼文

選取貼文複製成功(包含文章連結)!

微軟MAI-Image-2生圖模型登場!不只畫得逼真,連文字也能精準呈現,Copilot即將整合!

微軟MAI-Image-2生圖模型登場!不只畫得逼真,連文字也能精準呈現,Copilot即將整合!

微軟在人工智慧生圖領域再次取得重大突破。微軟 AI 執行長穆斯塔法·蘇萊曼(Mustafa Suleyman)於 3 月 19 日在 X 平台宣布,正式推出第二代圖像生成模型 MAI-Image-2。這款新模型在具備高度公信力的 LMArena 圖像生成模型排行榜中表現亮眼,直接衝上全球第三名,展現出威脅 Google 與 OpenAI 領先地位的強大實力。

力壓群雄,直追 Google 與 OpenAI

LMArena(原名為 LMSYS Chatbot Arena)在 AI 業界被視為反映模型真實戰力的全球風向標,是各大科技巨頭展示技術實力的最高競技場。根據最新的排名顯示,MAI-Image-2 目前位居第三,僅次於 Google 的 gemini-3.1-flash-image-preview 以及 OpenAI 的 gpt-image-1.5-high-fidelity。

微軟MAI-Image-2生圖模型登場!不只畫得逼真,連文字也能精準呈現,Copilot即將整合!

回顧微軟的發展歷程,這進步幅度堪稱驚人。微軟在 2025 年 10 月推出初代模型 MAI-Image-1 時,初始排名僅位列第九。雖然初代模型以生成速度快、避免內容重複為賣點,但在影像綜合品質上仍明顯落後於其他頂尖實驗室。而這次推出的第二代模型,憑藉著硬核的技術提升,完全扭轉了先前的劣勢。

精準還原光影,告別亂碼圖表

在實際表現上,MAI-Image-2 能夠精準還原自然的光影效果與真實膚色,並建構出極其逼真的物理環境。不過,最令業界驚艷的莫過於其文字渲染能力的顯著增強。

實測支援中文表現不錯

 

過去 AI 生圖最常被詬病的痛點,就是影像中的文字容易出現模糊或亂碼,導致無法製作精準的圖表。微軟研發團隊對此進行了深度優化,讓 MAI-Image-2 在處理包含文字的資訊圖表、簡報投影片以及複雜的邏輯圖表時顯得游刃有餘。對於有高難度創作需求的使用者,它也能輕鬆生成包含超現實概念、華麗構圖以及具有宏大世界觀的電影級超清影像。

微軟MAI-Image-2生圖模型登場!不只畫得逼真,連文字也能精準呈現,Copilot即將整合!

微軟MAI-Image-2生圖模型登場!不只畫得逼真,連文字也能精準呈現,Copilot即將整合!

目前,急於嘗鮮的使用者可以直接登錄 MAI Playground 平台進行免費體驗。微軟也表示,正逐步將 MAI-Image-2 整合至 Copilot 以及 Bing 影像建立者(Bing Image Creator)的底層架構中。待推送完成後,廣大的使用者就能在日常操作中直接調用這項強大的功能。

對於中文的呈現目前仍會有亂碼的問題

微軟這次的表現確實讓人眼睛一亮。過去大眾普遍認為生圖領域是 Midjourney 或 OpenAI 的天下,微軟的模型往往被貼上速度快但品質普通的標籤。

然而,MAI-Image-2 解決了 AI 繪圖中最難攻克的文字精準度問題,這對於商務簡報與專業繪圖領域來說,無疑是一大福音。隨著這項技術全面導入 Copilot,微軟在 AI 應用端的競爭力將會再次大幅提升。

 

 

janus
作者

PC home雜誌、T客邦產業編輯,曾為多家科技雜誌撰寫專題文章,主要負責作業系統、軟體、電商、資安、A以及大數據、IT領域的取材以及報導,以及軟體相關教學報導。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則