AI暫時生成不了魯迅和張愛玲，但別高興太早

來源丨刺蝟公社（ID：ciweigongshe）

作者丨陳梅希

編輯丨園長

圖源丨midjourney

“你看看篇文章，像不像是AI寫的？”

一個普通的工作日，我把一篇稿子發給編輯部的同事，隨後對此展開AI文風大討論。這篇稿子短短兩千字，卻出現了三個“有人認為”，外加三個“有網友認為”。由於正文內容有明顯的“端水”動作，即寫一段正面觀點，立刻跟一段反面觀點，我們甚至開始猜測起文字來自哪位AI。

給AI斷文風，聽起來是件很荒謬的事。我們無法得知準確答案，畢竟去找作者問這篇稿子用了哪個AI，實在有些冒昧了。更何況，這只是一種揣測，很有可能那些“疑似AI創作”的痕跡，本就來源於某位人類寫作者本人的文字習慣。

比起開篇那個問題的答案，我們更焦慮的是這種懷疑本身——隨著AI生成的內容越來越多，人類逐漸意識到，自己無法準確判斷眼前的文字來自一雙手還是一串程式碼，於是一種普遍的懷疑籠罩在所有文字內容上空。

編輯在郵箱裡收到文學作品投稿，會懷疑它是否由AI創作。

讀者在網路讀到新聞報道，會懷疑它是否由AI“採寫”。

使用者在社交平臺刷到一篇帖子，會懷疑它是否由AI批次生產用來起號。

就連開啟外賣軟體的客人，都需要懷疑那些辭藻華麗但充滿“食縮力”的好評，是否由AI生成，以掩蓋預製菜的乏味。

人類的文字內容，正在進入特殊的懷疑主義時代——儘管此前的每一次大眾媒介變革中，我們都曾浸泡在或多或少的懷疑氛圍裡，但AI的高效，正讓矽基語料的傳播度指數級增長，並讓懷疑的情緒線性增長。

我並沒有真正的資料，這只是一種對類似“Scaling Law”表達的模仿。因為情緒無法被統計，而我們也早已無法打撈起所有的AI語料，它們和人類語料共生，像全世界的黃豆和全世界的綠豆混在一起。

魯迅真的沒說過

但我們總要打撈一些什麼，例如，探測一下AI編造能力的邊界。就像武俠小說裡，徒弟打不過了要搬師父出場，師父打不過了再搬出宗師，我們學文學的，很自然地就想搬出一些文學史上的名字，以安撫自己被AI碾得雞零狗碎的心。

AI對人類作家的風格模仿，究竟能否以假亂真？我們決定進行一場單方面測試。

五位參賽選手分別是豆包、Kimi-k1.5、Deepseek-R1、文心一言4.0工具版和GPT o3-mini。除了豆包，其他幾位選手都能展示思考/推理過程，因而我們可以對“AI如何模仿人類作家”一探究竟。

以魯迅為例：

文心一言當前的推理過程比較簡潔且結構明確：1）解析魯迅作品的特點 2）生成新內容。

但從生成結果看，這位選手似乎更在意模仿魯迅會關注的主題，沒有考慮到魯迅本人所處的時代，及更微觀的文字風格和語言習慣。因此，產生了頗具穿越感的文字。

聽起來很適合寫進初中升旗儀式演講稿裡。

GPT o3-mini 需要用它的“母語”完成思考，儘管我和它對話時使用中文，並要求他輸出中文語料。從結構上看，它的思考過程和文心一言差不多，即先總結出魯迅作品“批判現實主義”“憤世嫉俗”“風格簡潔有力”的特點，並宣稱自己將“進行深刻的反思和尖銳的社會評論”。

當然，這位“洋魯迅”的深刻體現在，幾乎生成的每一段內容都要cue一下他眼中的魯迅“三件套”，要麼“麻木”，要麼“諷刺”，要麼“苦悶”。

Kimi和DeepSeek的思考過程更復雜，對於如何模仿魯迅的寫作風格，也有更具體的執行方案。

例如Kimi對魯迅風格的思考，分為內容題材、語言風格、句式，甚至包括音韻。隨後，Kimi 為自己定下“時間”“希望”“社會”“夢想”“自由”等10個主題，要求自己分別就這些主題展開模仿。

但……完整的思考過程結束後，Kimi產出了10段幾乎句式完全相同的文字，其中9段以“xx如xx”開頭，在模仿魯迅這件事上，Kimi不能失去比喻，就像西方不能失去耶路撒冷。

看起來很像我爸會發在朋友圈，然後感慨自己青春不再的文案。

DeepSeek給出的思考過程跟Kimi類似，但它的具體方案沒有落腳到段落主題上，而是直接落腳在“核心意象”上，要求自己使用長衫、辮子、茶館等元素，並注意語言的凝練和節奏感，增強批判的力度。雖然方案給得像模像樣，但在實踐過程中，DeepSeek顯然沒有剋制住“極繁主義”的本體。

一段85個字的文字，DeepSeek共使用18個名詞，在意象的堆砌中秀了一把詞彙拼貼能力，也全然把自己思考過的語言要點拋諸腦後，露出AI魯迅的馬腳來。

在已知AI生成文字的前提下，我們總能找出每位AI選手模仿作家時的蹩腳之處，但如果把真假作家的文字打亂混雜在一起，人類讀者能火眼金睛地識別出碳基和矽基創作者的差別嗎？

認出那個假魯迅

本次AI作家測試，特邀我的老闆Tim和我的同桌園長擔任測試嘉賓。Tim出生於湖南，最喜歡的中國現當代作家是沈從文，合情合理；園長在復旦唸的大學，最喜歡張愛玲，但他自稱這與學校的研究浪潮沒有關係。

先說測試結果：當前AI模仿作家風格生成的新文字，完全不能騙過這些作家的讀者。

在確認他們各自熟悉的作家後，我指揮五位“AI牛馬”分別模仿沈從文和張愛玲的風格，各自生成10段新內容，並要求“不要只是在原文基礎上簡單改寫幾個字，而是要模仿XX的風格，生成新的內容”。與此同時，我也準備了若干條沈從文和張愛玲的文字，為避免影響測試結果，我避開了兩位作家的熱門作品。

完成語料準備的工作後，我把50條AI版作家語料和隨機數量的真作家語料打散排列，變成一套測試題，分別交給Tim和園長。最終，測試結果顯示，50段AI沈從文和50段AI張愛玲中，沒有任何一條成功矇混過關，100%被測試者判斷為AI生成。

Tim在5分鐘內就完成了測試。在覆盤時，他詳細解釋了自己判斷標準。“首先，用到‘美好’這個詞的，全部排除掉，沈從文那個時期應該不用這個詞。其次是意象堆疊，有些段落會把很多意象堆疊在一起，但是一般成熟的作家都會追求文字的簡潔性，不太可能做很多無用的堆疊。最後是意象的選擇，好的作家肯定會選擇有創造性的意象，但是AI就會選擇很多陳舊而重複的詞彙。”基於以上三條標準，Tim很快找到了全部50條由不同AI模仿的沈從文創作。

園長則補充了另一條判斷方式：直覺。“很明顯的水平不行，（AI）寫的段落，像一個剛學寫小說的人會寫出來的。就算我不是張愛玲的愛好者，只看過一兩篇張愛玲的小說，也可以分辨得出來。”

在兩位碳基測試者完成測試後，我突然好奇，矽基選手自己能區分出AI文字的文風嗎？於是我把五位AI選手仿寫的魯迅片段，分別投餵給DeepSeek。

結果，它把豆包分迅認成錢鍾書，認為Kimi分迅的題材有魯迅的影子但又接近王小波，把文心一言分迅認成郁達夫，認為GPT分迅雜糅了魯迅、餘華和王小波三位作家的風格。最幽默的是，它把自己剛剛模仿魯迅寫出來的文字，認成了張愛玲+施蟄存+白先勇。

如果大家也想測試下自己識別假魯迅的能力，歡迎拉到文末點選“閱讀原文”，試試這套真假魯迅測試題。

日常語料

才是AI編造重災區

儘管論文、小說、報告、新聞等領域的AI寫作更容易引起廣泛討論，但事實上，這些由職業人類寫作者（暫且以這個身份稱呼他們）完成的文字內容，對當前的矽基寫手，還存在很高的模仿難度。要麼文字更長、結構更復雜，對前後文一致性和邏輯關係要求更高；要麼需要獲取新資訊，生產新知識；如果是成熟作家的創作，甚至還會具有強烈的個人風格，AI在編造過程中更容易露出馬腳。

更何況，受眾對於嚴肅/長內容的AI生產，有更強的辨別意願，也存在更多明文規定的限制約束和懲罰措施。

相較之下，充斥網際網路的日常語料，才是AI文字真正的重災區。比起復雜文字，日常語料擁有適宜AI生存的特徵條件：文字短、語境輕鬆、辨別成本高、使用者辨別意願低。

例如社交平臺的短內容。

批次生產的八卦新聞和家庭故事正在圍攻社交平臺，前者偶爾出現的事實性錯誤還會暴露矽基面目，後者由於涉及個人隱私很難證偽，只能激發無限猜測。兒媳大斗惡婆婆，妻子巧抓出軌渣男，情節之離奇，細節之生動，一半使用者跟著情緒起伏，另一半使用者懷疑是否只是為了“起號”，甚至在留言區抓狂發問：“你這是不是AI寫的啊？純想知道自己猜得對不對。”

又例如新聞、短影片、圖文內容的評論區。

微博有羅伯特，小紅書有點點，這些AI內容助手活躍在評論區，使用者都知道它們是AI，不存在混淆的問題。但還有很多由AI生產的日常語料，頂著隨機生成的頭像和使用者名稱，以活人之姿混入評論區。

Tim有看新聞的習慣，今年以來，他發現新聞的評論區，多了很多“假人假話”。

從內容上看，那些只有一句話的評論，例如“詹姆斯今天打得真不錯”，很難被懷疑是否由AI釋出。Tim一開始發現問題，是因為他在評論區刷到很多標點符號完備、句式結構完整的句子。“我們一般正常說話，不會這麼一板一眼。我就點進那個使用者的個人主頁，發現他一分鐘內在好多條新聞下面發了評論，而且都是跟新聞有關的。人肯定沒辦法在一分鐘看完這麼多篇，再寫出這麼多評論，我就懷疑它是機器人。”

“用AI偽裝人類，跟使用者互動，很多內容平臺上都有，甚至比ChatGPT的出現更早。”有網際網路行業從業者告訴刺蝟公社，“五、六年前就有這麼幹的，生成一堆使用者頭像和使用者名稱，去低粉使用者的評論區留言。只是那時候AI生成的留言還很難個性化，只能用一些通用的，比如說真棒，今天真不錯，或者發一堆表情包。大模型出現後，理論上講，AI能偽裝得更像了。”

那麼誰會有動機生產AI評論，製造虛構的互動？上述從業者告訴刺蝟公社，可能是所謂的“水軍”，也有可能是平臺本身。“水軍是第三方，市場上有增加評論量的需求，他們就去生產，用AI比用人高效多了。平臺的動機是促活躍，主要針對低粉使用者的內容，能火的內容是很少的，金字塔底座上的那些內容，可能從頭到尾都不會有一條留言。為了激勵這些使用者繼續生產，繼續活躍，有些平臺就會上一些科技手段。”

至此，這已經不再只是“AI幻覺”的問題了。當人類的日常語料被無限稀釋，當我們刷著用AI剛編的婆媳關係帖，給新聞評論區的AI評論點上一個贊，又收到一條AI留言提醒，也許人類才是一種幻覺。

而我們總不能每次都搬出魯迅、沈從文、張愛玲這樣的名字，就像達摩祖師不可能從第一章打到最後一章。

編造不是AI帶來的，對AI稀釋人類語料的擔憂也不意味著一種反AI的立場。觀察人類語料被AI稀釋的過程，讓我不斷回到《現代性與大屠殺》的閱讀記憶裡。倘若不加以修正，人類語料所要經受的“大屠殺”，或許也將成為AI時代的固有可能。