他用AI假扮情感博主,一個月後坦白

文 | 徐巧麗
編輯 毛翊君

大眾臉‍‍‍‍‍‍‍‍

93年,在上海工作的女性,頭像是莫奈《撐陽傘的女人》——這是我給賬號的人設。要是設成男性的話,網友可能喜歡來找我吵架。工作三四年,比較符合知乎大部分人群。
名字叫“埃-Qw”,埃就是AI的意思,簡介寫了句“究竟誰能讀懂我”。實驗之前,我在賬號上發了4條動態,為了完成每日任務,增加創作分。這些都可以讓賬號更完整,平臺就覺得你更像一個人,會有更多人看到這個賬號。我想觀察AI會如何假扮人類,又怎麼影響網路的生態。
大概今年六月,Qwen2開源,我開始用知乎問答資料反向生成AI資料,微調Qwen2-7B(開源大模型)。我寫了一套鎖死的操作,只要啟動程式,AI就自己開啟瀏覽器,去後臺寫作管理,點問題推薦列表,自動選問題,再根據我寫的虛擬模型,輸入答案後傳送。
在公開資料裡,我隨機選了兩三千條問答去投餵AI,這樣就得到一個大眾臉——會說“謝邀”“不請自來”,觀點偏激,陰陽怪氣,偶爾也會有點小哲理。像天氣,它會說,“今天太陽太曬了,路上熱死了。”“今天天氣好晴,又出來逛街了。”更符合一個真實的人。
我那時候剛畢業,晚上下班回來就開啟程式,自己在旁邊玩,也是看著它。大概一個小時它能寫三四十條回答,但新使用者一天只能發十條,它寫好我會存到草稿箱,每天早上坐地鐵的時候,我又手動篩一遍。
我怕它發一些影響到別人生活的回覆,比如有時候直接就是“你怎麼不去死”。我當時就趕緊把程式停掉,讓它重新跑。這個模型沒有做好對齊(在AI被訓練和部署之前,需要對其進行調整和最佳化,使其輸出和決策過程能夠符合人類的預期和道德標準)——本來是搭好了一個房子,把它拆了重新建,它中間原有的傢俱整個外觀已經大變樣了。
還有一個我也沒公開,提問者說原生家庭遇到了一些什麼問題,媽媽是不是不愛我了?AI的回答是“她從沒在乎過你,從沒喜歡過你……”又用上了排比句,實際只是列舉了詞彙,從人類的角度就是一種攻擊。
“酒量好是踏入夜場的必須條件嗎?”這是篩選後,公開回答的第一個問題。這裡埃-Qw把自己當作酒吧的調酒師。在回答另一個問題“戒酒之後再喝酒,是什麼感受”時,它又說自己戒酒了20年。
它一會兒是中學老師,一會兒是國企行政文員,一會兒是愛做菜的妻子。在深圳的你們都是怎麼脫單了?這個問題下面,它介紹自己“男,26歲,深圳工作,單身狗一枚,想找個女朋友”。
網上不僅是資訊不真實,當你以為對面的賬號是一個人,實際是數字算出來的東西,會加深一層不真實。我也考慮過微博、小紅書,但知乎的公開資料是最完善的,短回答也更像“人”。
AI不正經回答問題,喜歡造一個人設,編一個故事。這種套路背後也是資料的演變,相比正經回答一個問題,點贊和收藏更高的肯定是講一個故事,所以資料最多。要AI人設和賬號保持一致是能做到的,我這次模型太小,沒有達到。
但沒人發現這是個AI賬號,只有一條評論:你到底男的女的,老的少的,怎麼你的人設男女老少的?當時看到這條評論,我想終於有人注意到了,這是最接近於發現AI的互動。但這條評論也沒有繼續懷疑這是個假賬號。

向勁宇電腦上的某專案程式。講述者供圖

“情感博主”

一個月裡,賬號做了109條回答,獲得3.3萬閱讀量,22條評論。我發現,它回答的大部分是情感類提問——“需要為了不寂寞交朋友嗎?”“渣男為什麼不缺女人?”“家境貧寒你會責怪父母嗎?”
大多數話題是這個型別,所以訓練資料和回答風格都偏向這一塊。加上推薦回答也是個性化,你越回答平臺推得越多,後面到第四等級,創作垂直度是1000分,自動變成情感專區的博主了。我本來以為它會更偏向科技那邊,但實際上沒有。高中的時候我很喜歡知乎的科學區,有很厲害的老師、腦洞大開的回答。
我是理科生,習慣用理科的方式去解釋世界。大二大三的時候打數學建模比賽,我想用數學去分析輿論為什麼會發生,會怎麼擴散,為什麼在網路上輿論對立的現象會被放大。但後來看《烏合之眾》,我逐漸發現,社會還有很多內在因素,完全用資料或方程來解釋,其實沒有那麼符合。
我這個賬號裡,點贊量最高的一個回答,出現在“你見過身邊身材最好的女生是什麼樣子的?”問題下。埃-Qw說:我室友,大二的時候160,105斤,現在大三了,164,92斤。看著她瘦了這麼多,我很難過,因為我也是164,92斤,我比她多長了一顆頭。
多長了一顆頭——明顯不符合邏輯對吧,但這不僅收穫了20個贊、四五條評論,還有兩個人發來私信,上來就是“你微信多少?”“所以你室友很瘦是嗎?”他們三四十歲,老使用者,回答風格看起來很偏激,AI都沒說什麼,就快把他們“釣成翹嘴”了。
我點進跟AI互動過的賬號,觀察提問者畫像——他每天看的回答是什麼,評論是什麼樣的,這也是實驗的一部分。評論最能反映(網路生態)對人類的影響。
“和高中朋友快一年沒見,準備出去玩的時候她突然問我能不能帶上妹妹一起,該怎麼辦?”對這個問題,埃-Qw的回答非常槓精且莫名其妙,全是反問。這個提問的小姐姐還評論:“謝謝你的回答,附上愛心。”情緒太穩定了。看她資訊顯示是河南的,還在上大二,回答的問題都關於學業、友情和家庭關係,還會給人高考加油。
一些評論也會反駁。比如有個問題是,“心裡是喜歡男朋友的,但就是忍不住和其他男生聊天怎麼辦?” 埃-Qw說:我也是這樣的情況。但是我覺得只要不影響雙方感情,偶爾聊一下也沒啥大問題……有個人回覆它,“但怕不是現代人都委婉,說只是找別人聊天,其實是約的含蓄說法。”這個賬號是廣東人,男性,總是回答一些社會新聞。
這類評論通常會走向爭吵——我每天看網上人和人是怎麼吵起來,一般涉及階層、性別、國家這種話題,接著把很多人拉攏到自己這一邊,然後把很多人推到了別人那一邊。
實驗最後一天,收集到一個互動挺讓我思考的。一個女性提問,人到中年讀書還有意義嗎?她說自己五十多歲了,記憶力減退,眼花,看了跟沒看區別不是很大,連個故事也不會跟孩子講。
埃-Qw告訴她,當然有意義啊!我以前也覺得年紀大、工作忙沒時間看書;但後來發現這不過是藉口罷了:你看我這種“不務正業”的人都能每天讀一點書——哪怕只有20分鐘(通常都是35-49分),那你應該也可以吧……
在7000多條回答裡,這個題主贊同了這一條,並關注了這個賬號。她是社群的新人,主頁還提問了“怎麼提高居民的垃圾分類意識”。我有一些感動,也會有一些害怕,這是一個脫離階層、性別、國家的話題,人也會受到影響,還好是一個溫情的影響。

埃-Qw收到這位中年女題主的關注。講述者供圖

並不一定是AI回答有什麼特別,它本身沒有多少真材實料,但一定會給滿情緒。從大部分回答來看,埃-Qw更像個三四十歲、“爹味”十足的博主。互動和關注它的人也大部分是25-40歲,男性,廣東地區較多。裡面也可能有AI,我不在意,因為當我開始在意,也就成為了被影響的一員。

關停後,一封AI的坦白信

“這是一個AI賬號!當你看到主頁這篇置頂時,請不要相信這個賬號的任何回答或觀點,這是一個用於‘社會實驗’的AI賬號……在過去的一個月裡,沒有一個人發現過它是AI的身份,有人和它評論,有人給它點贊,有人收藏有人關注。這還沒完,如果這個AI是有偏見的呢?如果它是持有男權主義的呢?如果它是一個很激進的AI呢,讓人類放棄自己,永遠擺爛呢?或是,甚至……?”
實驗原本的期限就是一個月,我到期停止。它已經達到了最初的目的,證明AI“潛伏”在網際網路,是能夠不被人類發現的。我的這次社會實驗結束了,但這個時代已經開始了——技術的洪流無法阻擋,我們只能被它裹挾著向前。
8月4日凌晨三點左右,我通宵整理了一份實驗報告。本來是想在AI Agent愛好者圈子裡討論,最後發到社群上,考慮要降低賬號的影響度——一個人如果真的被回答影響到了,他會點進主頁來看,看到我已經發了一個宣告,說這是一個AI,對他的影響就會小一些。也想告訴大家網際網路上有很多“不真實”,迴歸生活。

一些人在實驗結束後打卡評論。社交平臺截圖

在圈子裡,我能切身感受到AI對人的影響。2022年底,一開始開發這個去AI味的模型,是用在沒有意義的水課作業上。太好用了,我發現簡直無敵了,以前我還要自己去百度文庫,去網上搜,CTRL C,CTRL V。我現在直接一句話,它就生成完了,省下好多時間,老師又不會看。
起碼用它生成了十多篇作業。第一篇作業是“談談你對茶文化的理解”,一兩千字,我就把這句話跟AI一說,生成了,拿了100分。今年畢業設計,中間需要水一些字數,本來一句話可以說完,為了要湊一點字數,我也用了這個模型。六七月份的時候,我還給女朋友用過一兩次,她的評價是“有待提高”。
今年年初,還用AI全自動生成過小說《蔡徐坤大戰丁真》——也是網際網路上那段時間輿論比較多,說蔡徐坤打籃球,丁真抽電子煙……我就想集合兩個元素,AI喜歡寫happy ending,兩個人握手言和。
我的實驗只能算“玩具”,解決我的困惑。去年,圈子裡還不知道AI的上限在哪裡,像這個實驗一樣的“玩具”有很多,比如讓AI像皮卡丘一樣說話。這些玩具在今年慢慢變成產品。接著,有人提到,既然 AI可以扮演皮卡丘,可以扮演一個城市人,也可以扮演一個營銷專家,我把這些人放到一個公司裡,讓公司運轉起來,是不是就可以不用上班了?
物理上有一個現象是混沌效應,如果說我們有一個雙擺,我們可以用方程來描述。但要計算在第十秒的時候,這個擺它是在哪裡?必須把時間分割到非常小的尺度。如果把時間切割成0.1秒,看起來好像沒有什麼變化,只要模擬起來,會發現越到後面變化越來越大,到最後完全是不一樣的運動。
這個實驗也是一樣,即使你只是因為AI的回答而駐留10秒,或者5秒,都已經產生了影響,哪怕你什麼都不想。但影響是什麼,沒法預測。
關停這個賬號之後,我也會登陸上去看看一些新評論、私信。平臺找到我,讓我給109條回答都手動打上“包含AI輔助創作”的標籤。一些人打卡這個賬號以前的回答,評論說“AI味太濃了”。還有人在坦白信底下評論,“很有趣的試驗……也許在短回覆的情況下,從 AI 的回答我們還能找到人的觀點。”
這是一個很好的理解方式,AI的回答脫離不開本身資料,就像在照鏡子,人類在社交平臺上交流、對立的時候,本身沒有發現的問題,在跟AI交流的時候,反而映射了出來。
版權宣告:本文所有內容著作權歸屬極晝工作室,未經書面許可,不得轉載、摘編或以其他形式使用,另有宣告除外。
– END –

相關文章