AI学習データの「元罪」問題が最も強力な法的挑戦を受けている。2度のピューリッツァー賞受賞者であるジョン・カレルが主導し、数多くの著名な著者が最近、米国カリフォルニア州北地区裁判所に集団訴訟を提起した。オプンエイ、グーグル、メタ、アンソロピック、XAi、ペラックス・AIの6社を共同被告として指名し、これらの企業が大規模モデルの訓練に盗作本を体系的に使用し、意図的な著作権侵害を構成していると訴えている。もし罪名が成立すれば、各作品に対して最大15万ドルの賠償金が発生し、総額は数十億ドル乃至数百億ドルに及ぶ可能性がある。

「二重の盗作チェーン」が明らかに

訴状では、被告会社が明確な不正利用のサイクルを形成していることが明らかにされた:

1. 盗作取得:LibGen、Z-Libraryなどの「シャドウ図書館」から数百万冊の著作権保護された本(小説、非フィクション、学術書など)を一括でダウンロードしている。

2. モデルトレーニング:これらの違法データをChatGPT、Gemini、Claudeなどの大規模モデルに使用している。

3. 商業的収益化:APIサブスクリプションや企業サービス、広告などの形で収益を得ており、原作者には一切報酬を支払っていない。

原告側は、「作家の文章はAIの知性の基盤でありながら、無料の燃料となっている」と強調している。これらの作品はモデルの言語能力だけでなく、知識の深さや物語のスタイルにも影響を与え、数十億ドル規模のAIエコシステムの隠れた支柱である。

オプンエイが「訴えられやすい企業」に、サンフランシスコ裁判所がAI著作権事件の中心地に

これはAI企業が文字の著作権紛争に陥った初めてのケースではないが、本件は原告の権威性が高いこと、被告が広範囲にわたること、そして不正利用の連鎖が明確であることから注目されている。南都デジタル経済ガバナンス研究センターの統計によると、オプンエイは少なくとも14件の著作権訴訟に直面しており、業界における「訴えられやすい企業」である。また、本件の審理場所であるカリフォルニア州北地区裁判所(サンフランシスコ)は、すでに25件のAI関連著作権事件を受理しており、全国の同種事件の過半数を占めており、その判決結果がAI学習データの合法性に関する全国的な先例となる可能性がある。

故意侵权 vs. 合理使用:法律の境界線が裁決される

被告会社はこれまで多くが「合理使用(Fair Use)」を主張して抗弁してきた。AIのトレーニングは「転用的使用」であり、オリジナル作品の市場に悪影響を与えないとの主張である。しかし、今回の原告は「盗作の本質」に焦点を当てており、もしそのトレーニングデータ自体が違法に入手されたものであれば、「合理使用」の抗弁は成立しない。裁判所が「故意侵权」を認定すれば、賠償金は急騰し、AI企業がモデルを洗浄し、不正データを削除するよう義務付けられたり、関連サービスの停止を命じられる可能性もある。

業界の地震:AI学習データの供給チェーンが再構築される可能性

結果如何を問わず、この事件は警告として鳴り響いている:

- トップAI企業は出版社や著者協会との著作権許諾交渉を加速している(例えば、オプンエイがアソシエーテッド・プレスやShutterstockとの提携)。

- オープンソースモデルコミュニティはコンプライアンスの圧力を受けており、トレーニングデータの合法性を検証しなければならない。

- 「シャドウ図書館」は捜査の重点対象となり、データ収集ツールチェーンが審査されることになる。