
被譽為「歐洲版 OpenAI」的法國 AI 公司 Mistral,近期捲入爭議。一名前女員工爆料,Mistral 旗下模型 Mistral-small-3.2 疑似透過「蒸餾」(Distillation)技術,直接學習中國開源大模型 DeepSeek-v3 的輸出風格,卻未對外說明,導致基準測試結果與公眾認知被誤導。
語言指紋分析揭相似性
早在今年 6 月,就有博主透過「語言指紋」分析發現,Mistral-small-3.2 與 DeepSeek-v3 在輸出內容的用詞與片語出現高度相似。爆料者 Sam Peach 進一步分析模型在創意寫作任務中的高頻詞與 n-gram,並使用階層式聚類(hierarchical clustering)繪製相似性圖,結果顯示兩款模型的位置極為接近,難以解釋為巧合。
根據 AI 社群的技術常識,這種相似度很可能是因為 Mistral-small-3.2 透過蒸餾技術,直接「學習」了 DeepSeek-v3 的輸出模式。
蒸餾本身不違規 爭議在於透明度
蒸餾是大型語言模型開發的常見方法,可讓小模型快速吸收大模型的能力,降低訓練成本。然而,離職員工 Susan Zhang 指出,Mistral 的問題在於「假裝成自家模型透過強化學習獨立達到這個水準」,並隱瞞蒸餾來源,導致外界對其技術實力產生誤判。
多名開源社群成員認為,蒸餾模型必須清楚標註來源,保持透明性是維護研究與商業信任的關鍵。
歐洲 AI 明星公司的危機
Mistral 成立於 2023 年,總部位於巴黎,由前 Google DeepMind 成員 Arthur Mensch、前 Meta 成員 Guillaume Lample 與 Timothée Lacroix 共同創立,主打開源、多語言與推理能力。短短兩年內,公司估值在 2024 年 6 月達到 62 億美元,今年 8 月更傳出估值已達 100 億美元,並籌備 10 億美元新一輪融資。
其開源作品包括輕量級 Mistral Small、針對程式設計的 Mistral Code,以及聊天機器人 LeChat,在多語言處理與推理性能上獲得高度評價。
爆料衝擊 Mistral 在開源圈的信任基礎
由於 Mistral 長期以「開源透明」自居,這起蒸餾爭議對其品牌形象衝擊不小。許多觀察者認為,若 Mistral 能公開承認並標註蒸餾來源,社群反應可能會溫和許多。
截至目前,Mistral 官方尚未回應相關指控,就在爭議延燒之際,公司仍於昨日推出新模型 Mistral Medium V3.1,似乎意圖將焦點轉回產品。
- 延伸閱讀:你的顯卡跑得動哪些開源 AI?這款免費網頁工具幫你秒算!
- 延伸閱讀:中國 AI 開源最新榜單出爐:DeepSeek 拿下 AI 程式冠軍,阿里、字節猛攻多模態
- 延伸閱讀:微軟逐步開源 Windows 11 UI 框架 WinUI,預告四階段釋出計畫
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!