FB 建議貼文

選取貼文複製成功(包含文章連結)!

有「歐洲的OpenAI」之稱的 Mistral 模型被爆料蒸餾自 DeepSeek,離職員工批公司誤導公眾

有「歐洲的OpenAI」之稱的 Mistral 模型被爆料蒸餾自 DeepSeek,離職員工批公司誤導公眾

被譽為「歐洲版 OpenAI」的法國 AI 公司 Mistral,近期捲入爭議。一名前女員工爆料,Mistral 旗下模型 Mistral-small-3.2 疑似透過「蒸餾」(Distillation)技術,直接學習中國開源大模型 DeepSeek-v3 的輸出風格,卻未對外說明,導致基準測試結果與公眾認知被誤導。

有「歐洲的OpenAI」之稱的 Mistral 模型被爆料蒸餾自 DeepSeek,離職員工批公司誤導公眾

語言指紋分析揭相似性

早在今年 6 月,就有博主透過「語言指紋」分析發現,Mistral-small-3.2 與 DeepSeek-v3 在輸出內容的用詞與片語出現高度相似。爆料者 Sam Peach 進一步分析模型在創意寫作任務中的高頻詞與 n-gram,並使用階層式聚類(hierarchical clustering)繪製相似性圖,結果顯示兩款模型的位置極為接近,難以解釋為巧合。

根據 AI 社群的技術常識,這種相似度很可能是因為 Mistral-small-3.2 透過蒸餾技術,直接「學習」了 DeepSeek-v3 的輸出模式。

有「歐洲的OpenAI」之稱的 Mistral 模型被爆料蒸餾自 DeepSeek,離職員工批公司誤導公眾

有「歐洲的OpenAI」之稱的 Mistral 模型被爆料蒸餾自 DeepSeek,離職員工批公司誤導公眾

有「歐洲的OpenAI」之稱的 Mistral 模型被爆料蒸餾自 DeepSeek,離職員工批公司誤導公眾

蒸餾本身不違規 爭議在於透明度

蒸餾是大型語言模型開發的常見方法,可讓小模型快速吸收大模型的能力,降低訓練成本。然而,離職員工 Susan Zhang 指出,Mistral 的問題在於「假裝成自家模型透過強化學習獨立達到這個水準」,並隱瞞蒸餾來源,導致外界對其技術實力產生誤判。

多名開源社群成員認為,蒸餾模型必須清楚標註來源,保持透明性是維護研究與商業信任的關鍵。

有「歐洲的OpenAI」之稱的 Mistral 模型被爆料蒸餾自 DeepSeek,離職員工批公司誤導公眾

有「歐洲的OpenAI」之稱的 Mistral 模型被爆料蒸餾自 DeepSeek,離職員工批公司誤導公眾

歐洲 AI 明星公司的危機

Mistral 成立於 2023 年,總部位於巴黎,由前 Google DeepMind 成員 Arthur Mensch、前 Meta 成員 Guillaume Lample 與 Timothée Lacroix 共同創立,主打開源、多語言與推理能力。短短兩年內,公司估值在 2024 年 6 月達到 62 億美元,今年 8 月更傳出估值已達 100 億美元,並籌備 10 億美元新一輪融資。

其開源作品包括輕量級 Mistral Small、針對程式設計的 Mistral Code,以及聊天機器人 LeChat,在多語言處理與推理性能上獲得高度評價。

有「歐洲的OpenAI」之稱的 Mistral 模型被爆料蒸餾自 DeepSeek,離職員工批公司誤導公眾

爆料衝擊 Mistral 在開源圈的信任基礎

由於 Mistral 長期以「開源透明」自居,這起蒸餾爭議對其品牌形象衝擊不小。許多觀察者認為,若 Mistral 能公開承認並標註蒸餾來源,社群反應可能會溫和許多。

截至目前,Mistral 官方尚未回應相關指控,就在爭議延燒之際,公司仍於昨日推出新模型 Mistral Medium V3.1,似乎意圖將焦點轉回產品。

 

 

 

Qbitai
作者

量子位(Qbitai)專注於人工智慧及前沿科技領域,提供技術研發趨勢、科技企業動態、新創公司報道等最新資訊,以及機器學習入門資源、電腦科學最新研究論文、開源程式碼和工具的相關報導。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則