AI寫故事的底層操作系統其實和人類完全不同,很多時候即便頻繁更換提示詞也難以扭轉。5月28日,沃頓商學院教授在社交平臺上分享了馬里蘭大學計算機系團隊聯合Google DeepMind發表的重磅研究成果。該研究表明,通過一套名爲StoryScope的自動化分析管道,僅憑情節、主體、時間結構等維度的敘事特徵,檢測AI寫作的準確率就高達93.2%。

在這場規模宏大的“文學解剖”實驗中,研究團隊收集了上萬個寫作提示,並對比了人類作者與Claude、DeepSeek、Gemini、GPT、Kimi五個大語言模型生成的六萬多篇故事。結果顯示,AI在怎麼編故事這件事上被困在了一個狹窄的默認敘事模板裏,暴露出了極其明顯的“敘事指紋”。

image.png

具體而言,AI在寫作中普遍存在五大底層邏輯差異。首先,AI過於偏愛“說教”,有近八成的情況會在敘事中直接點明故事主題,甚至在對話中強行加入哲學討論,遠超人類作者的比例。其次,相較於人類擅長的非線性倒敘或插敘,AI只會一條道走到黑,其生成的作品中近八成都缺乏支線情節,且結局傾向於主角頓悟的“偉光正”套路。

更有趣的是,AI對“身體描寫”近乎上癮。由於缺乏真實的情緒體驗,AI無法直接感知難過或害怕,只能用教科書式的方式堆砌生理感受和環境隱喻,導致描寫往往違和、用力過猛。此外,AI缺乏“讀者意識”,極少打破第四面牆與讀者互動。

而在細分模型上,各家大模型的寫作缺陷也各有千秋。研究指出,Claude在情節推進上通常波瀾不驚、格外平淡;GPT則過度熱衷於在故事中頻繁使用夢境序列進行轉折;而Gemini則習慣默認採用外部視角去冷冰冰地描述角色,像在看人物檔案卡。

研究團隊目前已公開了該項目的全部代碼與敘事文本庫。這不僅爲文學界穿透表層去僞存真提供了一面“照妖鏡”,也給衆多依賴AI輔助創作的寫作者敲響了警鐘:大模型或許能模仿任何大作家的文風筆跡,但它永遠無法替人類去經歷真正的人生,而後者纔是好故事的終極來源。