FB 建議貼文

選取貼文複製成功(包含文章連結)!

小米開源首款推理大模型「MiMo」,7B 參數超越 OpenAI o1-mini 與阿里 Qwen-32B

小米開源首款推理大模型「MiMo」,7B 參數超越 OpenAI o1-mini 與阿里 Qwen-32B

小米正式宣布推出並開源旗下首個專為推理任務打造的大語言模型——Xiaomi MiMo。該模型由小米新成立的「大模型 Core 團隊」研發,聚焦數學與程式碼領域的邏輯推理能力,強調從預訓練到後訓練的完整推理能力提升。

根據官方介紹,MiMo 採用僅 7B(70 億)參數規模,在兩大公開測評數據集中表現亮眼,包括:

  • AIME 24/25(數學推理)

  • LiveCodeBench v5(程式碼生成與推理)

在這些測評中,MiMo-7B 不僅超越了 OpenAI 的閉源推理模型 o1-mini,也擊敗了阿里巴巴規模更大的開源推理模型 QwQ-32B-Preview,展現出小參數模型在推理能力上的極高潛力。

小米開源首款推理大模型「MiMo」,7B 參數超越 OpenAI o1-mini 與阿里 Qwen-32B

強化學習訓練下的亮眼表現

在 RL(強化學習)社群日漸壯大的背景下,MiMo-7B 與近來受到矚目的 DeepSeek-R1-Distill-7BQwen2.5-32B 進行同等條件下的比較。結果顯示,MiMo 在數學與程式碼任務的強化學習潛力明顯領先對手,即使在僅 7B 的參數下仍具備高效訓練價值。

小米表示,MiMo 全系列模型已全面開源,期望能促進 AI 推理領域的技術共創與應用推進。這也是小米首次對外公開自研大模型,象徵其在生成式 AI 戰略上邁出關鍵一步。

目前,小米尚未透露 MiMo 是否將整合至旗下產品(如 HyperOS、智慧手機或智慧家居裝置)中,但業界推測,MiMo 將成為其 AI 策略的重要基礎模型平台。

KKJ
作者

快科技成立於1998年,是驅動之家旗下科技媒體業務,中國極具影響力的泛科技領域媒體平台之一。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則