最近、SNSのX(旧ツイッター)でAI大手のAnthropicに関するリークが注目を浴びた。同社が数百万冊の本を大量に購入し、デジタルスキャンした後すぐに破棄しているという情報が広がった。この行動は、20年前のSF作家フーノ・ヴィンジの小説『虹の果て』に登場する出来事と驚くほど似ており、AI企業がトレーニングデータを取得する手段についての議論を引き起こした。

image.png

「パナマプロジェクト」が浮上:違法から「合法化」への代償

2026年初頭に公開された裁判記録によると、この「パナマプロジェクト(Project Panama)」という名前の活動は、Anthropic内で秘密裏に進められていた。この計画の主な目的は、「世界中のすべての本」を手に入れるためだった。そのために、Google Booksプロジェクトに関与した経験を持つ高級幹部を雇い、中古書店や実店舗から大量に本を購入した。

そのプロセスは衝撃的である:購入された実物の本は倉庫に運ばれ、表紙を切り取る形で「破壊的なスキャン」を行い、高精細PDFファイルに変換する。その後、残された紙の破片は直接回収会社に送られ破棄される。この方法は倫理的な問題を引き起こしたが、法的にはAnthropicは「初回販売原則」と「適正使用」に基づいて正当化している。すでに合法的にコピーを購入したのであり、スキャンされたものは内部でのトレーニングのみに使われ、外部には配布されていないため、著作権の二次的な不正流出を防ぐため、原件を破棄するのは妥当だと主張している。

15億ドルの法的コスト:著作権争いにおける新たな戦略

「パナマプロジェクト」の暴露は偶然ではない。以前、Anthropicは盗版電子書籍サイトLibGenからデータを取得していたとして複数の作家から訴えられたことがある。同社のCEOは、出版業者との個別許諾交渉がビジネス上も実務上も非常に困難であることを認めた。

法的リスクに対応するために、Anthropicは2025年に約15億ドルの和解金を支払って、初期の盗版データセットに関する集団訴訟を解決した。その後、会社は「パナマプロジェクト」のようなよりコストがかかるが法的リスクが少ない実物書籍の購入モデルに転向した。現在の裁判官は、このような「合法的な購入+スキャンによるトレーニング」のモデルが強い弁護の根拠を持っていると考えている。

真実と境界:過剰に広げられた「文化の災難」

この出来事はネット上で「人類の知識庫の蒸留」や「古書の惨禍」と表現されているが、現実にはそれほど極端ではなかった。調査によると、破棄された本は市場流通量の多い一般的な中古書であり、貴重な古書や文化財ではない。最も影響を受けたのは著作権の損失を心配する著者や出版協会であり、文博機関ではない。