近日,社交媒體X(原推特)上一則關於AI巨頭Anthropic的爆料引發了廣泛關注。消息稱,該公司正在大規模購入數百萬本書籍,在進行數字化掃描後立即將其銷燬。這一舉動被指與科幻作家弗諾·文奇在20年前的小說《彩虹盡頭》中的情節驚人相似,引發了公衆對AI公司獲取訓練數據手段的激烈討論。

image.png

“巴拿馬項目”浮出水面:從盜版到“洗白”的代價

根據2026年初曝光的法庭文件,這項代號爲“巴拿馬項目”(Project Panama)的行動由Anthropic內部祕密推進。該計劃的核心目標是獲取“世界上所有的書”。爲此,公司聘請了曾參與Google Books項目的資深高管,並投入鉅額資金從二手書零售商和實體書店大量採購圖書。

其操作流程極具衝擊力:工作人員將採購回來的實體書運往倉庫,通過切掉書脊的方式進行“破壞性掃描”,將其轉化爲高清PDF文件。隨後,殘留的紙質殘骸被直接送往回收公司銷燬。這種做法引發了倫理爭議,但在法律層面上,Anthropic辯稱這符合“首次銷售原則”和“合理使用”:既然已經合法購買了副本,且掃描件僅用於內部訓練而不對外分發,銷燬原件是爲了確保不會造成版權副本的非法二次流轉。

15億美元的法律代價:版權博弈下的新策略

“巴拿馬項目”的曝光並非偶然。此前,Anthropic因涉嫌從盜版電子書網站LibGen獲取數據而遭到多名作家起訴。其首席執行官曾坦言,與出版商進行逐一授權談判在商業和實踐上都極具挑戰。

爲了應對法律風險,Anthropic在2025年支付了約15億美元的和解金以平息針對早期盜版數據集的集體訴訟。隨後,公司開始轉向“巴拿馬項目”這種成本更高但法律風險更低的實體書採購模式。法官目前傾向於認爲,這種“合法購買+掃描訓練”的模式具有較強的辯護基礎。

真相與邊界:被放大的“文化災難”

儘管該事件在網絡上被描述爲“蒸餾人類知識庫”或“古籍浩劫”,但實際情況並非如此極端。據調查,被銷燬的書籍主要是市場上流通量較大的普通二手書,並非珍稀古籍或文化遺產。受影響最大的羣體主要是認爲版權受損的作家和出版協會,而非文博單位。

目前,關於AI訓練是否構成“合理使用”在美國法律界仍無最終定論,包括Meta和OpenAI在內的其他巨頭也深陷類似的法律泥潭。Anthropic這種將百萬實體書化爲“數字灰燼”的做法,雖然在技術邏輯上完成了高質量數據的迭代,但其背後的道德成本與法律邊界,依然是AI時代亟待解答的命題。