Meta 首席執行官馬克・扎克伯格在近期的法律訴訟中,藉助 YouTube 與盜版內容的鬥爭來爲公司在 AI 訓練中使用版權數據的做法辯護。此案名爲 “Kadrey 訴 Meta”,是美國法庭中衆多針對 AI 公司的版權訴訟之一,原告包括知名作家莎拉・西爾弗曼和塔 - 納希西・科茨。

版權 (1)(1)

根據最近公佈的扎克伯格證詞摘錄,他指出,儘管 YouTube 上可能會存在一部分盜版內容,但 YouTube 仍在努力將這些內容刪除。“大多數在 YouTube 上的內容應該都是合法的,他們有相關許可。” 扎克伯格表示。這番言論暗示着他對 Meta 使用名爲 LibGen 的版權電子書數據集進行 AI 訓練的立場。

LibGen 是一個鏈接聚合網站,提供包括 Cengage Learning、麥格勞 - 希爾和皮爾遜教育在內的多個出版社的版權作品。該網站多次因版權侵權被起訴,並被罰款數千萬美元。法庭文件顯示,儘管 Meta 的 AI 團隊對使用 LibGen 的法律風險表示擔憂,扎克伯格卻仍然批准了其用作訓練數據集。

在審問中,扎克伯格聲稱自己對 LibGen 並不熟悉,但表示,禁止使用 YouTube 這樣的平臺將是不合理的。“不,我不會希望對人們使用 YouTube 設定政策,因爲一些內容可能是受版權保護的。” 他說。他同時承認,Meta 在使用版權材料進行訓練時需要謹慎。

根據原告律師的最新指控,Meta 曾將 LibGen 上的某些盜版書籍與可供授權的版權書籍進行交叉參考,以決定是否應該與出版商達成許可協議。此外,原告還指控 Meta 在訓練其最新的 Llama 模型時使用了 LibGen 的數據集,並曾從另一個盜版源 Z-Library 下載電子書用於訓練。

Z-Library 也因版權問題遭到多次法律行動,其維護者在2022年被控版權侵權、網絡詐騙及洗錢等罪名。

劃重點:

📚 扎克伯格在法庭上引用 YouTube 的案例爲 Meta 在 AI 訓練中使用版權材料辯護。

🔍 原告指控 Meta 使用盜版書籍數據集 LibGen 進行 Llama 模型的訓練,並隱藏相關信息。

⚖️ Meta 面臨多起版權訴訟,相關法律風險引發了內部討論與關注。