一項新研究顯示,AI 模型經過僅兩本書的微調訓練後,可以生成著名作家的寫作風格,且讀者對這些作品的偏好甚至超過了專業模仿者。此項研究由聖 ony Brook 大學和哥倫比亞法學院的研究團隊進行,涉及了50位知名作家的風格創作,包括諾貝爾獎得主韓江和布克獎得主薩爾曼・魯西迪。

在研究中,159名參與者,包括28名寫作專家和131名非專家,通過衆包平臺 Prolific 評判了不同文本段落。評判過程中,參與者並不知道文本是由人類還是 AI 創作的。研究採用了兩種主要的 AI 訓練方式:上下文提示和特定作者微調。在上下文提示中,研究團隊使用了 GPT-4o、Claude3.5Sonnet 和 Gemini1.5Pro 三種主要的 AI 系統,給予相同的指令和樣本文本進行生成。而在特定作者的微調中,僅有 GPT-4o 支持所需的 API 功能,因此研究團隊爲30位作家購買了數字版書籍,併爲每位作家訓練了獨立的模型。
參與者被要求將兩段文本進行比較,並選擇他們認爲更優秀的一段。對於風格評估,參與者還會看到原作者的一段摘錄。研究結果顯示,使用基本的上下文提示時,專家對人類文本的偏好顯著,而非專家的選擇則相對分散。然而,在經過微調後,專家在風格方面更傾向於選擇 AI 生成的文本,數量增加了八倍;在寫作質量上,選擇 AI 文本的比例也達到了兩倍。現代 AI 檢測工具對標準 AI 輸出的識別率高達97%,而對經過微調的輸出則僅有3%。
此外,研究還發現,訓練數據的數量並不影響結果。一些僅出版過兩本書的作家,其風格也能被良好模擬。專家與非專家在評判標準上的趨同,表明經過微調的 AI 文本質量得到了普遍認可。由於專業的寫作費用高達2.5萬美元,而訓練 AI 的成本僅約81美元,經濟效益也相當顯著。
這些研究結果恰逢美國法院正在審理有關 AI 如何獲取和使用版權材料的訴訟。研究團隊建議,對於專門模仿特定作家的 AI,法律應有明確區分,可能需要禁止 AI 複製個人作家的風格,或要求對 AI 生成文本進行清晰標識。
劃重點:
📚 AI 模型僅需兩本書便可生成知名作家的寫作風格。
🧑🎓 經過微調後,讀者對 AI 生成文本的偏好顯著提高。
⚖️ 研究結果可能影響美國版權法及公平使用的辯論。
