Apple 近日陷入一場關於 AI 訓練數據的法律糾紛。數個知名 YouTube 頻道在加州北區聯邦地方法院對 Apple 提起集體訴訟,指控該公司違反《數位千禧年著作權法》(DMCA),非法抓取數百萬部 YouTube 影片用於開發其生成式 AI 模型。
Apple 研究論文提及「Panda-70M」數據集
綜合外媒報導,這起集體訴訟由知名頻道 h3h3Productions(Ted Entertainment 公司所有)、MrShortGame Golf 以及 Golfholics 發起。原告指稱,Apple 的研究人員在 2024 年底發表了一篇關於影片生成模型的研究論文,標題為《STIV: Scalable Text and Image Conditioned Video Generation》。
論文內容顯示,Apple 使用了一個名為「Panda-70M」的數據集進行模型訓練。訴狀指出,Panda-70M 本質上是一個索引文件,包含大量 YouTube 影片的 URL 連結、識別碼與時間戳記。雖然該數據集僅提供連結,但 Apple 被指控利用自動化工具與「旋轉 IP 位址」等技術,刻意規避 YouTube 的防抓取(anti-scraping)保護措施,將影片內容下載並切片作為 AI 訓練樣本。
原告:這是對創作者社群的「良心攻擊」
根據訴訟文件,原告頻道發現其版權內容在該數據集中出現超過 500 次:
- h3h3Productions:內容出現在 438 部影片中。
- Golfholics:內容出現在 62 部影片中。
- MrShortGame Golf:內容出現在 8 部影片中。
原告律師在訴狀中痛批,Apple 的行為不僅違法,更是對創作者社群「喪盡天良的攻擊」。他們認為科技巨頭利用創作者的心血來餵養價值數兆美元的 AI 產業,卻未支付任何補償,這對遵守 YouTube 規範的一般大眾極不公平。
原告除了要求法院將此案定為集體訴訟外,還提出以下要求:
- 判定 Apple 蓄意規避 YouTube 的版權保護系統。
- 支付最高法定損害賠償、律師費及相關利息。
- 發布禁止令,要求 Apple 停止任何侵權行為,並防止其繼續利用受版權保護的內容進行 AI 開發。
科技巨頭集體面臨抓取指控
事實上,Apple 並非唯一對象。原告 Ted Entertainment 先前已針對 Meta、Nvidia、ByteDance、Snap、Amazon 以及 OpenAI 提起類似訴訟,理由同樣是這些公司使用了 Panda-70M 數據集。
儘管 Apple 過去曾嘗試與康泰納仕(Condé Nast)、NBC News 等大型媒體洽談版權授權,被視為相對重視法律合規的 AI 開發者,但此次爭議顯示,即便是 Apple 也難以在龐大的 AI 訓練需求與著作權保護之間達成平衡。
在此之前(2026 年 3 月),Apple 也曾因涉及使用包含盜版書籍的數據集「The Pile」而捲入另一場版權官司。這系列案件預計將對 AI 產業如何合法取得影片訓練數據產生深遠影響。
資料來源:AppleInsider、MacRumors、9to5Mac
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!