小米開源首款推理大模型「MiMo」，7B 參數超越 OpenAI o1-mini 與阿里 Qwen-32B

小米正式宣布推出並開源旗下首個專為推理任務打造的大語言模型——Xiaomi MiMo。該模型由小米新成立的「大模型 Core 團隊」研發，聚焦數學與程式碼領域的邏輯推理能力，強調從預訓練到後訓練的完整推理能力提升。

根據官方介紹，MiMo 採用僅 7B（70 億）參數規模，在兩大公開測評數據集中表現亮眼，包括：

AIME 24/25（數學推理）
LiveCodeBench v5（程式碼生成與推理）

在這些測評中，MiMo-7B 不僅超越了 OpenAI 的閉源推理模型 o1-mini，也擊敗了阿里巴巴規模更大的開源推理模型 QwQ-32B-Preview，展現出小參數模型在推理能力上的極高潛力。

強化學習訓練下的亮眼表現

在 RL（強化學習）社群日漸壯大的背景下，MiMo-7B 與近來受到矚目的 DeepSeek-R1-Distill-7B 及 Qwen2.5-32B 進行同等條件下的比較。結果顯示，MiMo 在數學與程式碼任務的強化學習潛力明顯領先對手，即使在僅 7B 的參數下仍具備高效訓練價值。

小米表示，MiMo 全系列模型已全面開源，期望能促進 AI 推理領域的技術共創與應用推進。這也是小米首次對外公開自研大模型，象徵其在生成式 AI 戰略上邁出關鍵一步。

目前，小米尚未透露 MiMo 是否將整合至旗下產品（如 HyperOS、智慧手機或智慧家居裝置）中，但業界推測，MiMo 將成為其 AI 策略的重要基礎模型平台。