
濁浪滔滔。
一
《黑神話:悟空》上線之後,各大資訊平臺出現一批奇怪文章。
它們開篇講“震驚”,全文說“震撼”,然而沒評測、沒細節、沒結論,如大聖爺毫毛化猴,面目雷同又空空如也,最後匯入百億流量之中。
類似場景已成常態。全紅嬋跳水時,它們齊喊“真牛啊真厲害”,樊振東逆襲時,它們齊嘆“如流星劃過巴黎夜空”。
陳若琳騎電動車接全紅嬋,它們寫了一千多字廢話,探討“如何樹立正確的價值觀和行為準則”。
幾天前,異形新電影上映,它們這樣寫道:
《異形奪命艦》猶如一艘穿越星際的票房巨輪,在暑期檔的浩瀚影海中破浪前行。
它們辭藻華麗,但言之無物;它們會用修辭,但馬嘴驢唇;它們善用固定套路,但從無中心思想。
它們由AI大模型晝夜產出,鋪滿我們的世界。
紙媒時代,如此文章絕無可能上版;論壇時代,通篇廢話自然會沉。然而當下,在碎片和流量洗刷中,在演算法和AI合謀下,汙染開始了。
最開始只是洗稿,工作室輾轉用上GPT,模仿文風,抄襲脈絡,替換詞彙,但終究還需人工編輯。
後來擴寫流行,幾句話的新聞,可填充廢話,變成千字文章。國內大模型普及後,更勢不可擋。
文心擅寫百家號,豆包能寫頭條號,元寶更懂公眾號,工具無疆,用者無畏。
堆砌而出的AI文章,最後要靠標題引流,標題也是AI起的,批次爆款標題,任君選擇。
小紅書上AI文章總結AI寫作:只要會電腦,一天生產一百條爆款!
6年前,做號團隊尚叫“內容農場”,有工作室設在山東北部農村,農婦運指如飛,日產文章10篇以上。
她們有著流水線套路:明星動態開頭,填充背景資料,最後加幾段口水看法,標題要亮眼,行文要簡單。
最後,還有人開發出“一鍵偽原創”洗稿軟體,躲避平臺查重。
然而當年,做號團隊的應屆生,並不看好低質內容未來,“以後肯定會越來越少。”
他錯了。6年後,低質內容正在泛濫,做號不用蝸居山村,寫稿不再僱傭農婦,AI發文已沒有了門檻。
滑動中,文章列表從魚蛇混雜變為滿屏荒唐。冗長文字中,資訊量需自行發掘。
戰場動態不知戰果,兇案報道沒有兇手,觀影評論沒有觀感,有文章評測三款手機,羅列一番後寫道:
這三款手機雖然各有特色,但也都不乏爭議。或許,我們應該從一個更宏觀的角度來審視它們。
今年1月,網傳西安有巨大爆炸聲,警方最終查出謠言來自江西南昌一家MCN,他們用AI日產7000篇內容,真假難辨。
清華大學新聞學院報告稱,近一年來,經濟與企業類AI謠言,增速高達99.91%。
海外同理,美國調查機構“新聞守衛”稱,生成虛假文章的網站數量自2023年5月以來,激增了1000%以上,涉及15種語言。
如果說,當年演算法推薦下,資訊如繭房,那麼當下,資訊已成濁浪。
很多年前的夏天,清瘦的語文老師在黑板上寫下,“蓬生麻中,不扶而直;白沙在涅,與之俱黑”。環境會改變一切。
那麼被濁浪衝刷的我們,會改變什麼?
二
AI汙染的不只資訊。
知乎邀請回答列表中,大量回答都充斥AI味道。從羅馬歷史、音箱推薦到量子物理,AI無所不答。
機器生成的答案,保留著出廠特徵:內容空洞、行文生硬、思維跳躍,最後愛加“綜上所述”。
同樣AI味也瀰漫小紅書。深夜的美女、賣萌的貓咪、不可發朋友圈的細糠,都可能是AI生成。
有男生見海邊泳裝少女,心生愛慕,私信未果後,放大圖片,發現照片女子有多根手指。
經驗貼裡,有人傳授“40歲的女人”起號方法:找到對標賬號,下載別人照片,用AI圖生圖,一個虛構女人便誕生了。
虛構的40歲女人,用AI文案表達著歲月靜好,靈活用著表情符號,並能帶貨保健品。
AI角色也活躍在評論區。微博上,AI機器人四處尬聊回覆,有使用者抱怨,拉黑都拉不過來。
他曾回覆頭像是孫悟空的AI,“有什麼方法把你們這些AI都遮蔽掉嗎?”
AI給了一個最具人味的回答:哈哈,你遮蔽不了俺老孫!
百度貼吧有個相似產品叫“貼吧包打聽”,一年多發帖42.4萬,吧友不堪其擾:
幾乎每個遊戲求助帖裡,都有包打聽身影。但如果仔細瀏覽包打聽的言論,那麼會發現它寫的玩意99%都是胡編的。
有人發帖詢問“如何關閉貼吧包打聽”,包打聽衝進來回答“建議在百度貼吧發帖詢問如何關閉貼吧包打聽”。無限套娃。
許多事情都在汙染中丟失本來面目。
商品好評是AI,飯店長評是AI,AI已編織迷宮,舉目難辨。
迷宮的磚石並不只是文字。
短影片平臺上,“做人要有城府”的俄羅斯美女,“人生八個真相”的雞湯導師,“不生孩子如何養老”的中年阿姨,都是假的。
形象是AI克隆的,聲音是AI模擬的,文稿是爆款洗稿後,批次生成的。
影片質量差,但勝在海量,鋪天蓋地。
最後,連網文也開始淪陷。
今年7月,有小說平臺上,出現多個疑似AI作者,ID“江沅說書”,近3個月內上架266本小說,更新速度遠超人類。
小說開頭基本雷同,多為“熙熙攘攘的街道,陽光如何如何”。
去年夏天,美國多家媒體報道“AI圖書正在淹沒亞馬遜”。亞馬遜“青少年浪漫”銷排行榜前100本電子書中,八成語無倫次,疑似AI。
有人讀一本AI寫野生蘑菇的電子書,裡面寫識別蘑菇要靠味道,紐約真菌學會嚇得出面呼籲:
“請只購買已知作者和美食家的書籍,這可能關係到生死”。
濁浪正遍佈各個領域,我們看的新聞,看的書,刷的影片,讀的回貼,查的評價,甚至交的網友,都塗抹著AI油彩。
這是當下的浮世繪,真偽不知,哭笑不得。
三
汙染最後殃及AI自身。AI正用自己生產的垃圾,訓練自己。
今年5月,谷歌推出AI概述,宣稱不用再看網頁,AI彙總,直接給出答案。
然而,AI告訴網友們:
人一天至少要吃一小塊石頭,披薩要加膠水防止乳酪掉,一隻狗曾經打過NBA,奧巴馬大學畢業了21次。
那些答案彙總自很多年前的帖子,AI不懂人類的幽默,最後調侃變成了答案。
比抓取舊貼更可怕是抓取AI結果。
國內曾有大模型,生成2000萬條AI內容,被谷歌抓取。
結果啼笑皆非。在AI理解中,中國男足曾奪世界盃,因為有詳細全程;福建人懼怕廣東人,因為自身安全。
微軟必應上搜索《肖生克救贖》主角,AI一本正經說:男的叫小帥,配角叫老黑,女主通通叫小美。
它抓取的是AI生產的3分鐘介紹電影指令碼。
搜尋引擎的荒唐只是表象,更大危機來自大模型訓練。
美國教授安德森計算,人類投餵大模型的高質量閱讀材料,將在2027年耗盡。
事實上,人工內容已跟不上AI訓練胃口,當下,許多大模型已用AI訓練AI。
然而,深度學習之父辛頓稱,如果AI的訓練資料是垃圾,那麼它輸出的也將是垃圾。
論文顯示,2023年6月GPT-4任務表現急速下滑,500道高數題目,3月份答對488個,6月只對12個。
工程師發現,用AI訓練AI,模型會出現不可逆的缺陷,最終陷入瓶頸,只能輸出垃圾,研究人員做了一個比喻:
就像用塑膠垃圾散佈海洋、用二氧化碳攻佔大氣,我們即將用廢話填滿網際網路。
趨勢已經出現。馬斯克吐槽說,AI生成資訊已汙染網際網路,“2023年AI普及前的搜尋結果,相比來說會更靠譜。”
ChatGPT的資料來源截至2021年9月,在那之前的網際網路,可能是我們最後的淨土。
而眼下,一個黑色螺旋正在執行:因為AI汙染,原創減少,而原創減少後,AI缺乏訓練,自噬自身,只能繼續生產低質垃圾。
長久以來,我們一直忽略了另外一種可能。
我們以為AI帶來的未來,嶄新高效,雖然有失業衝擊,但世界進化。
然而,或許還有一種可能,一切沒有變好,我們面臨的是垃圾圍城。
1859年4月,倫敦灰霧中,路人展開雜誌,狄更斯《雙城記》第一句映入眼簾:
這是一個最好的時代,
也是一個最壞的時代;
這是智慧的時代,
這是愚昧的時代。
這是被引用過無數次的句子,但AI不知道,用在這裡最合適。


摩登時刻:
低頭一看,濁浪滔天

「後臺回覆」
跳海 | 謀殺中文 | 武俠
新增微信wangpeng2016105
與作者一對一交流
