
生成式AI長期因資料來源、內容侵權與高能耗問題備受爭議。近日,美國一項針對AI公司Anthropic的法庭案件揭露,該公司在訓練其語言模型Claude時,曾大規模購入實體書籍進行掃描,導致數百萬本紙本書遭到永久性銷毀。
上百萬本書拆解掃描後即丟棄,紙本書全毀
根據法院公開的文件,Anthropic為訓練Claude模型,購買了大量實體書,將其裝訂線剪除、拆頁後進行數位掃描,並於掃描完成後直接丟棄書籍殘骸。這些數位檔案並未公開釋出,也非用於電子書銷售,僅作為AI訓練資料使用。
法官認為,由於該行為未以商業形式再利用,且具有「轉化性」目的(即非單純複製而是用於訓練生成式模型),可視為合理使用的一環。這也是本案中法院判定Anthropic在部分指控中勝訴的原因之一。
儘管如此,法院也指出,Anthropic在模型訓練中仍使用了「影子圖書館」中帶有盜版的內容,這部分並不構成合理使用,因此公司仍需於2025年12月出庭應訴,若罪名成立,最高恐面臨每本侵權書籍15萬美元(約新台幣480萬元)賠償金。
AI產業法律風險日增
許多批評者強調,即使模型未公開書籍原文,AI仍有能力「逐字再現」內容,且原作者與出版商在此過程中未獲任何授權或補償。Meta前高層曾坦言,若生成式AI完全遵守著作權法,「可能會在一夜之間崩潰」,凸顯整個產業對「資料量」的依賴程度。
與此同時,Getty Images執行長也承認,已無力全面處理AI產生的版權侵害案例;而迪士尼則正在對圖像生成平台Midjourney提起訴訟,試圖遏止其對受保護內容的模仿與盜用。
- 延伸閱讀:日本國會也質疑「AI吉卜力」是否違法,日本官員說明:單純模仿畫風或創意不構成侵權
- 延伸閱讀:AI 訓練資料侵權?美國聯邦法院首例著作權判決解析:科技巨頭敗訴
- 延伸閱讀:AI 生成肖像侵權有解?YouTube 開放申訴刪除看起來或聽起來像你的AI生成內容
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!