版權保衛戰開打：Elsevier 等出版巨頭聯手起訴 Meta，控告 Llama 侵權「盜版」百萬部作品

人工智慧領域的版權衝突再度升溫。包括Elsevier、Hachette及McGraw-Hill在內的多家全球出版巨頭，週二於曼哈頓聯邦法院正式向 Meta 提起集體訴訟。出版商指控 Meta 在訓練其大型語言模型 Llama 時，大規模使用了未經許可的盜版書籍與學術期刊文章，數額高達數百萬部。

從教科書到科學論文：Meta 遭指控系統性侵權

美國出版商協會主席 Maria Pallante 在一份措辭嚴厲的聲明中指出，Meta 的行為並非所謂的「推動公眾進步」，而是赤裸裸的大規模侵權。

這場訴訟的核心爭議點在於「合理使用（Fair Use）」的法律解釋。Meta 等科技公司一貫主張，AI 模型是利用受版權保護的材料來創造具有「顯著創新性（Transformative）」的新內容，因此不應視為侵權。

然而，出版商反駁稱，模型輸出的高度精確性直接威脅了原始作品的市場。目前法律界對此仍存在巨大分歧，去年兩位主審法官針對類似案件就做出了截然不同的裁決，這也讓本案成為未來 AI 產業發展的重要風向標。

Anthropic 花15 億美元和解的前車之鑑

事實上，Meta 並非唯一的被告。近期已有數十名作家、視覺藝術家與新聞機構向 OpenAI 及 Anthropic 等公司提起類似訴訟。值得注意的是，由亞馬遜與 Google 支援的 Anthropic 已成為首家達成和解的主要 AI 巨頭，去年同意向一組作者支付 15 億美元以解決集體訴訟。

這一案例無疑為 Meta 帶來了巨大的法律壓力，若 Meta 最終敗訴，不僅可能面臨數十億美元的額外賠償，甚至可能被迫重新訓練或刪除部分已訓練好的核心模型。

隨著訴訟在曼哈頓聯邦法院推進，專家預測這將引發一場關於數位內容版權的「大妥協」。目前，出版商不僅是在尋求經濟補償，更是在尋求建立一套長期的 AI 訓練授權機制。對於 Meta 來說，旗下的 Llama 作為目前最強大的開源模型之一，其數據來源的合法性一旦受挫，將直接動搖其在全球 AI 競爭中的戰略佈局。這場法律戰最終可能演變為科技業與出版業的一次大規模商業聯姻，或是一次徹底的技術斷裂。

AI 模型的「智慧」本質上是建立在人類數千年的集體創作基礎之上。過去幾年，科技公司享受了無償使用海量數據的「法律真空期」，但隨著商業價值日益巨大，出版商必然會要求分享這塊利益蛋糕。