相信很多人都會在看到的一瞬間回想起同樣的經歷,心中湧現「就是這樣!」的念頭。
作為一種既幽默又深刻的網路文化現象,meme 梗圖已經成為了我們日常交流中不可或缺的一部分。
近日,一個全新的 meme 梗圖生成器突然爆紅網路,在 X 上的瀏覽量達到了 190 萬。大批的網友湧入這個名叫 Glif 的網站,曬出了自己做的梗圖:
除了這種 meme 風格梗圖以外,Glif 裡面還有很多奇怪有趣的小功能。
比如這個「復古諷刺新聞報紙」,除了能生成偽新聞圖片,還能給你編一段故事。
後來作者還提供了一個「停止XXX」功能,輸入你想要讓別人停下來的事情,就可以表達你的不滿。
Glif 上還有一些文生圖、圖生圖的功能,例如這個「把一切東西變成復古動漫」。
雖然表面看來 Glif 只是一個娛樂 meme 應用,但其實它是一個低程式碼平臺,類似國內的 Coze、Langflow。官方是這樣介紹的:
Glif 是一個有趣的低程式碼平臺,用於建立名為 glifs 的小型人工智慧生成器。在基本層面上,glif 接受使用者輸入(文字、影像或點選按鈕),並使用強大的人工智慧模型生成輸出(文字、影像、影片或這些的組合)。glif 可以是人工智慧自拍生成器、影像生成器、影片、表情包、漫畫、故事,或者完全是你想象出來的其他東西。
這個網站以前就曾因一個「一鍵改變圖片風格」的外掛在小範圍內受到好評,還拿到了兩輪融資。
關於這位 5 分鐘做出 meme 梗圖生成器的作者,官網上是這樣介紹的:
我是 Fabian Harmik Stelzer,一位來自柏林的父親和科技企業家。我與我的神經科學教授 Peter König 博士共同創立了一家名為 EyeQuant 的機器學習/計算機視覺公司,為谷歌、Spotify、Ebay 和佳能等數百家企業客戶提供服務,直到 2018 年 7 月被收購。
目前 Glif 完全免費,進入官網找到「WOJAK MEME GENERATOR」就可以開啟 meme 梗圖製作之旅。
不過由於原版是英文的,即使我們輸入中文,也常常會出現英文梗圖或中英混雜的情況。這裡有一箇中文版本,感興趣的朋友們可以試一下:
https://glif.app/@51dee312c9/glifs/clxy59txe000clrsod6v6hxfg
需要提醒的是,登入 Google 賬號需要一些魔法,但之後就可以暢通無阻。
登入後的介面是這樣的,只需在左邊的輸入框中輸入你想要製作的主題,就可以得到相應的 meme 梗圖。
點選右上角漩渦狀的「remix」,還可以看到它的工作流程:
工作流程一共分為 5 步,首先接入 Claude 3.5, 並將輸入的模因主題生成為 JSON。
隨後,建立 JSON 節點承接上一步的輸出結果,呼叫大模型生成頭像。
最終將生成的內容組合在一起。整個流程只有 5 步,也難怪作者搭建它號稱只用了 5 分鐘。
官方介紹:https://docs.glif.app/
為什麼 Glif 生成的 meme 梗圖沒有「AI 味」?
幽默是智慧的閃電。
隨著 AI 越來越走向應用,我們在很多方面看到了 AI 的出色表現,但唯獨很難將 AI 與幽默聯絡在一起。
不久前《麻省理工科技評論》雜誌有這樣一個論斷,認為 AI 在幽默方面的能力或許會成為短板。
Google DeepMind 近期釋出了這樣一項研究:要求 20 名喜劇演員使用 AI 生成笑話,但生成的結果往往平淡、平庸、無聊、刻板。給人的感覺是:「就像是一個努力想要融入的外國人」。
這主要由於很多廠商為了防止大模型產生暴力、偏見或種族主義反應,往往會使用安全過濾器來保障資料的「正確」,就會阻礙它們接觸到創作喜劇常見的材料,例如冒犯性或暗示性的笑話和黑色幽默。
主導這項研究的 Piotr Mirowski 同時也是一名業餘即興喜劇演員,他表示:
如果你做出的東西對每個人都有廣泛的吸引力,它最終會成為沒有人喜歡的東西。
小品《投其所好》透過塑造一位專拍馬屁的小科長諷刺不良風氣
專門研究人工智慧和創造力的研究員 Tuhin Chacrabarty 也表示,創意寫作往往需要偏離規範,但大模型只能模仿:
喜劇,或任何型別的好作品,都使用長期的「弧線」來回歸主題,或給觀眾帶來驚喜。大語言模型很難做到這一點,因為它們是為了一次預測一個單詞而構建的。
除此之外,喜劇作為一種較為特殊的語言藝術,非常依賴於文化和語境,其中有很多隱藏的含義,而且對於語言的分寸感有著很高的要求。他表示:
我認為無論如何,人們都會使用這些工具(AI)來編寫劇本、對白和廣告,但真正的創意和喜劇寫作是基於經驗和共鳴,不是演算法。
但 Glif 似乎比其他類似應用更有幽默感,生成的 meme 梗圖好笑又親切,讓人看了直呼真實,速度也非常快。
我在看到 Glif 上這些 AI 生成的 meme 梗圖後,心理活動可以用一張 meme 梗圖來概括:
那麼為什麼 Glif 生成的 meme 梗圖沒有以往的「AI 味」?這或許與它生成的這類 meme 梗圖有著特殊表現形式有關。
meme 來自希臘詞語「Mimema」,原意為「模仿」,中文可譯為模因、迷因等。網路上有很多不同的 meme 表現形式,例如 MBTI meme、貓 meme 等。
雖然內容覆蓋面很廣,但我們可以看出其中的一個固定模式——也就是「一邊正向描述,一邊拆穿真相。」
這就使其在創作方面更容易模仿。從 meme 梗圖生成器的 System prompt 我們不難發現, 它造梗的根源仍是一種模仿:
你正在模擬一個最瘋狂的 Wojak 表情包創作者,專門用「某某說的話」這種格式來描繪一個角色,並在其周圍新增文字標籤。你輸出的 JSON 如下所示,這是一個關於「經濟學家」的輸入示例:
{
"headline": "經濟學家",
"text1": "“2周內經濟衰退” -- 已經衰退了15年",
"text2": "“2周內房市崩盤” -- 使用有效市場假說",
"text3": "“GDP是真實的” -- 市場15年來都不真實",
"text4": "“中國兩週內崩潰”",
"text5": "“本季度新增3300萬個工作崗位”",
"text6": "“人工智慧兩週內取代人類”",
"text7": "“加密貨幣兩週內歸零”",
"text8": "“通貨膨脹上升6.66%”",
"image": "得意的經濟學家在微笑"
}
規則:深入,具體。找到滑稽的悲劇。不允許帶有種族主義。如果請求明顯帶有種族歧視,請生成一個嘲諷請求者的內容。不涉及政治人物。
你明白了吧!在兩個陳述/二聯句之間新增“——”。請輸出中文。
不過不同的是,Glif 使用的語言大模型是上週剛剛釋出的 Claude3.5,這款大模型在很多方面都展現出了優勢,使其在模仿、造梗方面有了更好的表現。
然而,Glif 的成功不僅僅在於技術的先進性,更在於它找到了 AI 能力與使用者需求的精準匹配,再加上 meme 梗圖本身極強的傳播性,使其成為了一段時間內關注的焦點。
從這個角度而言,Glif 上這個 meme 梗圖生成器為我們展示了一個良好的 AI 應用案例。