有「歐洲的OpenAI」之稱的 Mistral 模型被爆料蒸餾自 DeepSeek，離職員工批公司誤導公眾

被譽為「歐洲版 OpenAI」的法國 AI 公司 Mistral，近期捲入爭議。一名前女員工爆料，Mistral 旗下模型 Mistral-small-3.2 疑似透過「蒸餾」（Distillation）技術，直接學習中國開源大模型 DeepSeek-v3 的輸出風格，卻未對外說明，導致基準測試結果與公眾認知被誤導。

語言指紋分析揭相似性

早在今年 6 月，就有博主透過「語言指紋」分析發現，Mistral-small-3.2 與 DeepSeek-v3 在輸出內容的用詞與片語出現高度相似。爆料者 Sam Peach 進一步分析模型在創意寫作任務中的高頻詞與 n-gram，並使用階層式聚類（hierarchical clustering）繪製相似性圖，結果顯示兩款模型的位置極為接近，難以解釋為巧合。

根據 AI 社群的技術常識，這種相似度很可能是因為 Mistral-small-3.2 透過蒸餾技術，直接「學習」了 DeepSeek-v3 的輸出模式。

蒸餾本身不違規　爭議在於透明度

蒸餾是大型語言模型開發的常見方法，可讓小模型快速吸收大模型的能力，降低訓練成本。然而，離職員工 Susan Zhang 指出，Mistral 的問題在於「假裝成自家模型透過強化學習獨立達到這個水準」，並隱瞞蒸餾來源，導致外界對其技術實力產生誤判。

多名開源社群成員認為，蒸餾模型必須清楚標註來源，保持透明性是維護研究與商業信任的關鍵。

歐洲 AI 明星公司的危機

Mistral 成立於 2023 年，總部位於巴黎，由前 Google DeepMind 成員 Arthur Mensch、前 Meta 成員 Guillaume Lample 與 Timothée Lacroix 共同創立，主打開源、多語言與推理能力。短短兩年內，公司估值在 2024 年 6 月達到 62 億美元，今年 8 月更傳出估值已達 100 億美元，並籌備 10 億美元新一輪融資。

其開源作品包括輕量級 Mistral Small、針對程式設計的 Mistral Code，以及聊天機器人 LeChat，在多語言處理與推理性能上獲得高度評價。