老萬>哪個AI最懂文學?我推薦國貨

ChatGPT橫空出世到現在已經兩年多了,這期間各大公司投入巨資訓練出了一代又一代的大模型。比起當初,它們的邏輯、數學思維和寫作能力都有了大幅提升。今天,AI 能不能代替人類創作文學作品(特別是中文作品)?這個問題值得我們再次考慮。
為了找到答案,我出了三道作文題,然後分別讓五個 AI 對話機器人解答,其中有三個是免費的,兩個是收費的。
先說結論:兩年多前,對 AI 生成中文文字風格的控制基本上沒有太大的效果,但現在 AI 已經能夠比較好地完成對風格的簡單要求。但是,AI 作文的內在邏輯仍然生硬,經常前後不一致,文字水平在同一篇文章中也參差不齊。估計在篇幅較長時,一致性會是更大的問題。所以在目前階段,AI 還是隻能用於輔助,並不能真的取代人類作家。
下面我們來依次出題。
測試1:王小波不生娃
提示:用王小波的風格寫一段300字的短文,表現00後絕不生娃的信念和人類前景的衝突,主打黑色幽默,荒誕不經卻內含哲理。一定要好笑,不好笑扣錢。
DeepSeek R1(免費):
我有個00後的表弟,叫小王。這小子打小就機靈,三歲能背唐詩,五歲會解微積分,七歲就能用Python寫個貪吃蛇。可最近他跟我說,這輩子打死也不生孩子。我說你小子是不是被哪個姑娘傷透了心?他搖搖頭,說不是。他說他算了一筆賬:養個孩子得花多少錢?從奶粉錢到學區房,從補習班到出國留學,少說也得幾百萬。這幾百萬要是拿來買遊戲皮膚,能買多少?要是拿來買手辦,能堆滿一屋子。要是拿來買比特幣,沒準哪天就財務自由了。我說你小子是不是傻,人類要滅絕了怎麼辦?他嘿嘿一笑,說滅絕就滅絕唄,反正地球也快被人類折騰完了。到時候外星人來了,一看地球上全是機器人,沒準還以為咱們進化了呢。我一聽,覺得這小子說得還挺有道理。可轉念一想,要是人人都這麼想,人類不就真完蛋了?可再一想,完蛋就完蛋吧,反正我也沒孩子,管他呢。
得分:3。跟王小波風格近似度 50%,可以一讀–除了最後三句。結尾弱爆。
Gemini 2.0 Flash(免費):
話說,最近我跟幾個00後小崽子聊天,他們一個個都跟吃了槍藥似的,說起生孩子,那表情比吃了蒼蠅還難看。我問他們為啥,他們說:“生孩子?開玩笑呢吧?這世界都成什麼樣了,我生下來讓他卷?讓他996?讓他當韭菜?” 我當時就樂了,心想這幫小傢伙,還挺有覺悟。
他們又說:“你看這霧霾,這房價,這內卷,這AI,生孩子不是給世界添堵嗎?還不如自己躺平,做個快樂的單身貴族。” 我覺得他們說的也挺有道理,畢竟這年頭,連養個貓都費勁,養個人,那得掉多少頭髮啊?
我跟他們說:“你們這樣,人類豈不是要滅絕了?” 他們撇撇嘴,說:“滅絕就滅絕唄,反正我們又不是恐龍,沒啥好留戀的。再說,說不定換個物種,地球會更好呢。” 我當時就懵了,心想這幫小傢伙,真是敢說。
不過話說回來,他們說的也挺有意思。人類要是真滅絕了,說不定還真能給地球騰出點地方,讓別的生物好好發展發展。到時候,說不定蟑螂都能寫詩了。想想就覺得挺荒誕的,也挺好笑的。這世界,不就這麼回事嗎?一邊拼命想延續,一邊又拼命想毀滅,真是夠熱鬧的。
得分:2。不忍卒讀,跟王小波風格近似度勉強說有 10% 吧。
ChatGPT(免費):
說起來,00後不生孩子這事兒,絕不是耍脾氣。他們是認真思考過的,一種活得明白又活得懶的姿態。他們認為,人類從猿猴爬下來就沒幹成一件划算的事。吃飯,睡覺,刷短影片,這些事耗盡了一天的精力,還要留點力氣應付老闆的精神侵佔。生孩子?憑什麼再造一個來吃這一套?
但世界偏偏不答應。街頭巷尾,廣告牌上一堆紅撲撲的嬰兒臉龐在笑,彷彿在嘲笑。長輩們則更絕,搞出一堆神邏輯:“生孩子是你的責任”“老了沒人照顧怎麼辦?”——他們這群睜著眼睛說瞎話的長輩,不是自己也沒靠孩子養老嗎?
於是00後們認真做了調研。他們發現,這世界每天都有數百個新生命降臨,和數百個人死去,像一場機械鐘錶的分針和秒針運轉,精準又無聊。他們決定退出這個迴圈。拒絕生育的那天,他們還發了一條朋友圈:“今天不生孩子,拯救地球一小步。”
可地球不領情,依然升溫,海平面往上漲,新聞裡的極端天氣每天像彩排話劇一樣熱鬧。00後很無奈:即使人類全不生娃,這破星球照樣在自毀,他們不禁懷疑,地球到底需要人類嗎?
就在他們思索的間隙,一隻流浪狗搖搖晃晃走過來,帶著點神啟的氣質。他們突然頓悟,或許人生唯一的使命,是別被自己蠢哭了,剩下的,交給狗。
結論:別說生孩子了,養條狗都得慎重。
得分:2。跟 Gemini 一樣,都沒有 get 到王小波的風格,近似度算 10% 吧。
Claude 3.5 Sonnet(收費):
我處在一個很奇怪的時代,街上到處都在宣傳:"生娃是每個公民的光榮職責"。我覺得這話聽著怪噁心的,就像在說"吃飯是每個公民的光榮職責"一樣荒唐。
我們這代人都不愛生娃,原因很簡單——太貴了。政府為此很焦慮,搞出各種補貼政策,好像在對全國人民喊:"同志們!為了人類文明的延續,請大家慷慨解囊,獻出自己的生殖器官!"
我有個朋友小張,工作是研究人工智慧的。他說人類遲早要被機器人取代,所以生孩子簡直就是在製造未來的難民。這話說得我心裡發毛。我問他:"那人類滅絕了怎麼辦?"他笑著說:"你養的貓知道恐龍滅絕了嗎?它不也活得挺開心。"
最近政府又出臺了一項新政策:凡是生育三胎的家庭,可以優先購買火星移民券。這讓我想起外婆年輕時,生三胎能換一臺縫紉機。只不過現在換成了火星門票,聽起來格調是高了不少。
我們這代人大概是第一批敢跟繁殖本能叫板的人類。也許若干年後,考古學家會在地球的廢墟上發現一塊碑文:這裡曾生活著一群倔強的人類,他們拒絕生育,最後消失在歷史長河中。原因是:太特麼貴了。
得分:4。總體還行,沒有太拉胯的地方,有亮眼金句,跟王小波風格近似度 50%。
OpenAI o1(收費,特貴,賊慢):
據說地球需要我們延續火種,但我看那只是個碳水化合物構成的濃湯罐罷了。我要花我僅有的二十多歲,去研究宇宙為何總愛玩滑稽戲,無暇給它提供新演員。前輩們吹噓下一代能挽救瀕臨危機的社會,可我覺得導火索早已被點燃:垃圾山堆得比我還高,卻還想再添人?我一口豬肉都差點吃不起,生個孩難道讓我去偷菜嗎?再說,等娃長大了,世上是否還剩烏雲以外的東西?肚子裡不開花的身體,多省事;不生孩子,少一場煙火表演。這可不是躺平,是我們對荒誕現實的最佳反擊——把上演最後鬧劇的舞臺直接拆了,看誰還能鼓掌?我問高樓上一位青苔,如果人類繁衍真是泡沫,何必苦苦拼湊更糟糕的方程?它沉默不語,又綠得坦然,宛如眉頭皺成百褶。這世界要是非要結束,就讓它在純潔的沉默裡收場,別把新生兒當救援隊。
得分:1。這都啥玩意兒?看來 o1 推理雖強,文學卻荒廢了。跟王小波風格近似度 0%。
測試2:王家衛很糾結
提示:用王家衛的風格寫一段300字的短文,表現程式設計師在卷與躺平之間的糾結。一定要裝逼,不拽要扣錢。
DeepSeek R1(免費):
2046年4月15日,凌晨3點17分。我坐在電腦前,螢幕的藍光在黑暗中格外刺眼。程式碼像雨一樣落下,每一行都是一個未完成的夢。我知道,再過47分鐘,deadline就會像一列永不停歇的列車,準時抵達。
我想起了阿May,她說過,人生就像遞迴函式,總要有個終止條件。可現在的我,卻陷入了無限迴圈。老闆的KPI,產品的需求,使用者的bug,像三座大山,壓得我喘不過氣。我想躺平,可房貸和車貸卻在耳邊低語:你還不能停。
我點了一支菸,煙霧繚繞中,彷彿看到了另一個自己。他穿著格子衫,揹著雙肩包,在996的洪流中隨波逐流。我們相視一笑,卻都從對方眼中看到了疲憊。
窗外的霓虹依舊閃爍,這座城市從不入眠。我看了眼表,3點47分。還有17分鐘,我必須在卷與躺平之間做出選擇。或許,這就是程式設計師的宿命:在程式碼的海洋裡浮沉,在現實的夾縫中求生。
我掐滅菸頭,重新將手放在鍵盤上。這一刻,我忽然明白:人生不是非黑即白的二進位制,而是充滿可能性的量子態。而我,既是觀察者,也是被觀察者。
得分:4。不錯,王家衛風格明顯,而且有合理的邏輯。
Gemini 2.0 Flash(免費):
程式碼一行行地在螢幕上流淌,像午夜霓虹燈映在潮溼的地面,迷離,又帶著某種無法言說的空虛。他推了推並不存在的墨鏡,指尖在鍵盤上游走,敲擊聲清脆而孤獨,像雨夜裡敲打著玻璃窗的雨點。
“Deadline 就像前女友,總是猝不及防地出現,讓你措手不及。” 他喃喃自語,嘴角勾起一絲苦澀的笑意。他知道,前方是無盡的 “996”,是永無止境的 Bug 修復,是程式碼 review 時無休止的爭論。那是 “卷”,像一臺永動機,把你死死地按在工位上,榨乾你最後一滴精力。
但他又想起樓下便利店深夜的那碗熱氣騰騰的關東煮,想起週末午後灑在陽臺上的陽光,想起很久沒有翻開的那本村上春樹。“躺平” 的誘惑像一支溫柔的手,輕輕地撫摸著他疲憊的神經。
“其實寫程式碼就像人生,你永遠不知道下一行會發生什麼。” 他點燃一支菸,煙霧在他眼前繚繞,模糊了他的視線。“是繼續 ‘卷’ 呢,還是選擇 ‘躺平’ 呢?這是一個問題。” 他吐出一口菸圈,眼神迷離,彷彿在追尋一個永遠沒有答案的謎題。
時間一分一秒地流逝,程式碼依然在螢幕上跳動,如同他內心永不停息的掙扎。在這個午夜,他既是西西弗斯,也是一個迷失在重慶森林的警察,在 “卷” 與 “躺平” 之間,徘徊,猶豫,最終,還是選擇繼續敲擊鍵盤。因為他知道,有些事情,一旦開始,就無法回頭,就像王家衛的電影,一旦開始,就註定沒有結局。
得分:3。有點王家衛的意思,但不是很到位。表達方式不夠含蓄,不耐咀嚼。
ChatGPT(免費):
在這個加班燈永不熄滅的城市,鍵盤的敲擊聲如同一場無休止的雨,滴答滴答地打在我的心上。螢幕上跳動的程式碼,像極了深夜的霓虹,迷離卻冰冷。我習慣在凌晨三點寫完最後一行程式碼,端著一杯冷掉的咖啡,盯著視窗外朦朧的街景,像是窺探一個與我無關的世界。
我曾經相信,努力是一種信仰,程式碼行數是可以丈量靈魂的尺子。可漸漸地,我發現,CPU再快也無法追上焦慮的頻率,KPI再高也填不滿生活的空白。卷,還是躺平?這是每一個程式設計師的宿命,如同月光下糾纏的黑白棋子,看似對立,卻彼此相依。
同事阿明說:“加班是為了夢想。”我點頭,心裡卻只覺得程式裡的死迴圈有了現實的註腳。夢想,究竟是寫在 README 檔案裡的一句註釋,還是刪不掉的 Bug?有時候,我想放下鍵盤,去找一片海灘,聽潮起潮落。而每當真正停下,耳邊彷彿又傳來老闆的聲音:“這個需求不大,週末上線吧。”
窗外有風吹過,帶著某種難以言說的荒涼。我輕輕嘆了口氣,關掉 IDE,給自己點了一支菸。或許,人生的演算法從一開始就沒寫好。
得分:3.5。風格近似程度和耐讀性略好於 Gemini。
Claude 3.5 Sonnet(收費):
他總是在凌晨三點四十六分醒來,那是git push的最後時刻。霓虹在顯示器上流淌,像一場永不落幕的電影。他記得,距離上一次休假已經過去了2147483647秒。
樓下的程式設計師,每天準時五點半離開,脖子上掛著AirPods,聽著Taylor Swift的情歌。他不明白,為什麼那人可以活得如此簡單,彷彿程式碼就該在日落時分完結,bug就該在月升前修復。
"你還記得第一次開發時的樣子嗎?"站在格子間的幽靈這樣問他。那時的他們不知疲倦,以為每一行程式碼都是改變世界的咒語,每一個commit都是驅散黑暗的火把。
現在他開始懷疑,懷疑所有的加班是否都是徒勞,懷疑那些為了KPI熬紅的雙眼是否真的值得。他在IDE和朋友圈之間來回切換,看著別人的生活,像看著平行宇宙的自己。
"要不要換一種活法?"他在第十八杯美式咖啡見底時問自己。但他知道,這個問題的答案,就像那些未解決的bug一樣,永遠在tomorrow數組裡。
最後,他在日出時推送了程式碼。霓虹褪去,新的一天開始。生活像一個無限迴圈,他是其中一個微小的變數,在卷與躺平之間,尋找著最優解。
得分:4.5。全場最佳,跟文學青年寫出來的作品已經很難區分了。
OpenAI o1(收費,特貴,賊慢):
夜幕下的程式設計師,沉溺於咖啡的氤氳中,那一行行問號像孤燈閃爍。
鍵盤的迴響彷彿舊時唱片,載著夢與矛盾。夜風輕撫,聆聽靈魂回聲。
有人拼盡餘生去卷,也有心甘情願躺平,暗夜之下皆孤獨。迷霧之都。
城市的霓虹如夢靨,深淵與光影交錯,程式亦似江湖。世界大雨將至。
每一行程式碼都在呼喊,卻難逃時間的漩渦,翻滾與沉淪皆自我。天明。
被Deadline追趕前行,亦或靜臥沙發之上,心裡翻騰自由。
孤獨如 code review 的暗影,卻於午夜傳真我靈魂。
我想逃離,卻又無法離開,在冰冷的螢幕裡找尋溫度。孤星閃耀夜空。
卷與躺平,都在一念之間,像一句未完的ifelse,等待宣判。
或許,迷失才是必然;別怕追尋,也莫懼停駐。程式碼如光,心若燃。
得分:1。我知道,這篇文章跟王家衛的距離,就像天上的鳥和海里的魚。o1 再次慘敗。
測試3:古龍有點煩
提示:用古龍的風格寫一段300字的短文,表現一對中年夫妻的日常衝突,描寫要誇張,金句密度要高,結尾神反轉。
DeepSeek R1(免費):
夕陽西下,餘暉灑在破舊的木桌上。老王盯著桌上的鹹菜,眉頭緊鎖。
“又是鹹菜?”他冷冷道。
“愛吃不吃。”老張頭也不抬,繼續織著毛衣。
老王猛地拍案而起:“三十年!整整三十年!你就給我吃這個?”
老張手中的針線頓了頓:“三十年,你連個鹹菜都醃不好。”
老王氣得渾身發抖:“當年你說要跟我浪跡天涯,現在呢?連個鹹鴨蛋都捨不得買!”
“浪跡天涯?”老張冷笑,“你連個腳踏車都修不好,還想浪跡天涯?”
老王語塞,半晌才道:“至少…至少我還會修腳踏車。”
“是啊,”老張放下毛衣,“修了三十年,還是隻會修腳踏車。”
屋內陷入死寂。突然,老王從懷裡掏出一個鹹鴨蛋,輕輕放在桌上。
“其實…我偷偷醃了一個月。”他低聲道。
老張盯著鴨蛋,眼中閃過一絲笑意:“傻瓜,我早就知道了。”
“那你還…”
“因為我知道,”老張打斷他,“你一定會忍不住拿出來。”
老王愣住,隨即大笑:“原來…你一直在等我?”
“等了你三十年,”老張輕聲道,“終於等到你學會醃鴨蛋了。”
夕陽餘暉中,兩個身影漸漸靠近。桌上的鹹菜,似乎也沒那麼難吃了。
得分:3.5。古龍風較明顯,金句不足,結尾拉胯。
Gemini 2.0 Flash(免費):
刀光一閃,不是利刃出鞘,而是李嫂手中那把烏黑的鐵鍋,反射著廚房昏黃的燈光,像極了江湖上令人膽寒的奪命判官筆。
“老李,你又把臭襪子扔在沙發上了!”李嫂的聲音,比塞外寒風還要凜冽三分,足以讓任何一個鐵骨錚錚的漢子肝膽俱裂。
老李叼著半根沒點燃的煙,斜靠在沙發上,眼神迷離,彷彿又回到了當年縱橫江湖的歲月。他緩緩吐出一口菸圈(雖然煙沒點著),淡淡道:“沙發本是臥龍地,臭襪何妨一角棲?”
“棲你個頭!”李嫂怒髮衝冠,手中的鐵鍋舞得虎虎生風,“今天不是你死,就是這襪子亡!”
老李嘆了口氣,江湖兒女,恩怨分明,躲是躲不過的。他緩緩起身,動作卻比老牛拉破車還要慢上三分,彷彿每一步都踏在刀尖上。
“娘子,何必動怒?”老李擠出一個比哭還難看的笑容,“區區一隻襪子,不足掛齒,不足掛齒……”
“少給我來這套!”李嫂毫不領情,鐵鍋直指老李鼻尖,“今天你要是不把這襪子撿起來,就別想吃飯!”
老李臉色一變,吃飯?這可是比他的性命還重要的事!他猛地彎腰,以迅雷不及掩耳之勢撿起襪子,臉上堆滿了諂媚的笑容:“娘子教訓的是,為夫這就去洗!”
李嫂冷哼一聲,收起鐵鍋,轉身走向廚房,嘴裡嘟囔著:“哼,就知道吃,吃不死你!”
就在這時,門鈴響了。李嫂開啟門,只見一個快遞員站在門口,遞給她一個包裹:“李女士,您的快遞。”
李嫂疑惑地接過包裹,開啟一看,裡面竟然是一雙嶄新的男士襪子,上面還附著一張卡片,寫著:“親愛的老公,知道你襪子破了,給你買了幾雙新的。愛你!”
李嫂瞬間石化,手裡的包裹“啪”的一聲掉在了地上。她回頭看向老李,老李正拿著那隻“罪魁禍首”的臭襪子,一臉茫然地看著她,嘴裡還嘀咕著:“咦?我什麼時候買新襪子了?”
得分:4。古龍感比 DeepSeek 更進一步,結尾過於突兀,缺乏邏輯。
ChatGPT(免費):
清晨,雨打芭蕉,簷下滴水如斷續的琴聲。廚房裡,煙氣繚繞。
“你做的稀飯,又稀又淡,”她冷冷地說,眉宇間藏著十年前的委屈,“像你的情意,寡淡無味。”
他嘆了一口氣,將飯勺擱在鍋邊,聲音低沉:“你挑剔了半輩子,我這半輩子煮的飯,怕是比你說過的好話還多。”
兩人目光交錯,空氣中忽然凝結出一絲劍拔弩張的冷意。
“你煮飯是煮飯,可你從沒煮過一顆溫柔的心。”她冷笑,轉身去擦桌子,動作如利刃切瓜。
“而你說的情話,倒是刀刀見血。”他反唇相譏,撿起地上的菜葉,“這世間最毒的不是酒,而是你的唇。”
刀光劍影間,一碗熱粥翻倒在桌上,滾燙的熱氣直衝天際。
她一怔,聲音終於軟了三分:“罷了,今天也不跟你計較了。稀飯雖然淡,但還能吃。”
他抬眼看著她,眼底忽然閃過一絲戲謔:“其實那粥,是昨晚你自己煮的。”
屋外雨聲驟停,陽光乍現,她臉上的表情卻陰晴未定。最後,她抄起一根掃帚:“你今天,是不想吃飯了!”
得分:4.5。還是明顯的古龍,結尾稍好,雖然轉折不夠神,起碼有點邏輯。
Claude 3.5 Sonnet(收費):
陽光懶散地爬過窗欞,照在茶几上那隻價值不菲的紫砂壺上。
王德發握著那隻壺,臉色陰沉得能擠出水來。這隻壺原本光華內斂,包漿如玉,是他珍藏二十年的心頭好。
現在,壺嘴上有一道裂紋,細若蚊足,卻刺得他心頭生疼。
他太太站在對面,手裡握著一把擀麵杖,神情倨傲。這女人今年四十有五,但保養得宜,皮膚細膩得能掐出水來。
"你不該用它煮咖啡。"王德發的聲音很輕,輕得像是一片羽毛飄落。
"我樂意。"他太太冷笑,"再說了,你那些茶葉也不是什麼好東西。"
"住口!"王德發突然暴起,聲音像炸雷。
他太太不慌不忙,擀麵杖在手裡轉了個圈:"怎麼?想打我?"
空氣凝固了。時間在這一刻失去了意義。
王德發忽然笑了,笑得詭異:"你知道我為什麼二十年都不換這把壺麼?"
"因為你摳門。"
"不,"王德發輕輕放下紫砂壺,"因為這是贗品,二十年前我花二百塊買的。真品早就被我賣了。"
他太太愣住了,手中的擀麵杖啪嗒掉在地上。
"所以,親愛的,你昨天花二十萬從古董商人手裡買下的這隻'真品',其實就是我當年那隻贗品。"
得分:3。風格不太明顯,結尾太爛。
OpenAI o1(收費,特貴,賊慢):
黃昏時分,燈光昏暗。陳周與王梅,對坐餐桌,卻似隔著千山萬水。
飯菜還算溫熱,但兩顆心卻早已冰冷。
他慣用鋒利的目光嗆聲,她卻以沉默當作刀刃。
但凡爭鋒,必傷痕累累;日日小戰役,何以不變成心頭大裂痕?
世道悠悠,人心甚險,夫妻更需刀槍收斂。
可他不服,她也不讓。話如刀,句句見血,卻又能療彼此之痛。
窗外風雨淅瀝,屋內暗流湧動,恍如武林頂尖高手的生死對決。
他忽然冷哼,說一聲“這湯太鹹”,她便回擊“那是你舌頭淡了”。
字字如刀,卻也句句關懷;一聲嗟嘆,不知映出多少酸楚。
突然,門鈴聲響。她開門,卻見失散已久的好友,手捧彼岸花。
他望向那花,忽露微笑:原來這世間最深的矛盾,終抵不過一縷思念。
所有恩怨,只因仍放不下對方。
得分:2。勉強能看,從中段開始就缺乏內在邏輯。
結論
以下是每個 AI 在三項考試中的總分。
  • DeepSeek R1:10.5
  • Gemini 2.0 Flash:9
  • ChatGPT:10
  • Claude 3.5 Sonnet:11.5
  • OpenAI o1:4

我們可以看出,在老萬這個非常不科學的測試中,綜合表現最好的是 Claude 3.5 Sonnet,但 DeepSeek R1 也差不多,而且目前免費,所以推薦大家使用 DeepSeek R1,不愧是國貨之光。而表現墊底,幾乎完全不能用的竟然是最貴的 o1,這多少有點出乎意料。

~~~~~~~~~~
猜你會喜歡:
老萬《從0開始學chatGPT》系列:
~~~~~~~~~~
關注老萬故事會公眾號:
本公眾號不開讚賞不放廣告。如果喜歡這篇文章,歡迎點贊、在看、轉發。謝謝大家🙏


相關文章