人工智慧領域的版權衝突再度升溫。包括Elsevier、Hachette及McGraw-Hill在內的多家全球出版巨頭,週二於曼哈頓聯邦法院正式向 Meta 提起集體訴訟。出版商指控 Meta 在訓練其大型語言模型 Llama 時,大規模使用了未經許可的盜版書籍與學術期刊文章,數額高達數百萬部。
從教科書到科學論文:Meta 遭指控系統性侵權
美國出版商協會主席 Maria Pallante 在一份措辭嚴厲的聲明中指出,Meta 的行為並非所謂的「推動公眾進步」,而是赤裸裸的大規模侵權。
出版商指控 Meta 為了強化 Llama 的回答能力,從教科書、科學論文到獲獎小說(如 N.K. Jemisin 的《第五季》)無一不取,甚至將盜版網站的數據優先級置於正版學術研究之上。原告方要求法院授予其代表更廣泛版權所有者的資格,並索求具體金額未定的鉅額賠償,這標誌著創作者與科技巨頭之間的版權戰爭進入了白熱化階段。
這場訴訟的核心爭議點在於「合理使用(Fair Use)」的法律解釋。Meta 等科技公司一貫主張,AI 模型是利用受版權保護的材料來創造具有「顯著創新性(Transformative)」的新內容,因此不應視為侵權。
然而,出版商反駁稱,模型輸出的高度精確性直接威脅了原始作品的市場。目前法律界對此仍存在巨大分歧,去年兩位主審法官針對類似案件就做出了截然不同的裁決,這也讓本案成為未來 AI 產業發展的重要風向標。
Anthropic 花15 億美元和解的前車之鑑
事實上,Meta 並非唯一的被告。近期已有數十名作家、視覺藝術家與新聞機構向 OpenAI 及 Anthropic 等公司提起類似訴訟。值得注意的是,由亞馬遜與 Google 支援的 Anthropic 已成為首家達成和解的主要 AI 巨頭,去年同意向一組作者支付 15 億美元以解決集體訴訟。
這一案例無疑為 Meta 帶來了巨大的法律壓力,若 Meta 最終敗訴,不僅可能面臨數十億美元的額外賠償,甚至可能被迫重新訓練或刪除部分已訓練好的核心模型。
隨著訴訟在曼哈頓聯邦法院推進,專家預測這將引發一場關於數位內容版權的「大妥協」。目前,出版商不僅是在尋求經濟補償,更是在尋求建立一套長期的 AI 訓練授權機制。對於 Meta 來說,旗下的 Llama 作為目前最強大的開源模型之一,其數據來源的合法性一旦受挫,將直接動搖其在全球 AI 競爭中的戰略佈局。這場法律戰最終可能演變為科技業與出版業的一次大規模商業聯姻,或是一次徹底的技術斷裂。
AI 模型的「智慧」本質上是建立在人類數千年的集體創作基礎之上。過去幾年,科技公司享受了無償使用海量數據的「法律真空期」,但隨著商業價值日益巨大,出版商必然會要求分享這塊利益蛋糕。
- 延伸閱讀:AI作品有版權嗎?美國最高法院給你答案:AI獨立創作確定無版權
- 延伸閱讀:版權方出重手,Google 三年內移除 7.49 億筆影子圖書館 Anna’s Archive 連結
- 延伸閱讀:皮卡丘大量發生中!OpenAI「Sora 2」AI 生成式影片爆紅,同時埋下版權隱患
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!