全網最火的AI提示詞,讓劉強東王興也成了「兄弟」(含超全提示詞)

27 歲,沒拼爹媽、沒靠關係,靠自己搞定了人生第一張和世界首富的合照。
別誤會,這可不是偶遇馬斯克和黃仁勳,而是藉助 GPT-4o,基於一段 Reddit 上爆火的提示詞生成的。在這個「萬物皆可生成」的時代,合照的門檻早已不是物理距離,而可能是一段能騙過你眼睛的 Prompt。
你或許已經在社交平臺見過類似畫風:平日裡行蹤低調的周杰倫,在全國各大地標前拍照打卡;馬斯克、黃仁勳、奧特曼甚至愛因斯坦等人,也在國內各地景點「合影留念」。
部分圖片源自使用者@6369424578
甚至,你還能看到當下外賣大戰打得火熱的京東 CEO 劉強東和美團 CEO 王興,紛紛合體「現身」上海外灘、廣州塔等地,握手言和、笑容滿面。
當生成式 AI 橫掃社交平臺,「眼見為實」這句話,恐怕也該加個問號了。
當 AI 學會「拍廢片」,你還能分辨真假嗎?
無獎競猜,下圖中,一張照片是我上班途中用 iPhone 7 隨手拍攝的,另一張則是由 GPT-4o 根據同一段提示詞生成的。請你猜猜,哪一張是 AI 生成的作品?
答案將在評論區揭曉,你猜對了嗎?如果沒有,也不用介意。如今 AI 圖片的逼真程度,確實讓人防不勝防,所以也真不怪 OpenAI 嚷嚷著要給 ChatGPT 圖片要加水印了。
而這一切的起點,始於一位突發奇想的網友用一段極其「敷衍」的提示詞讓 GPT-4o 生成圖片,結果反而炸出了一組「堪稱真實攝影風格教程」的影像。
Prompt:An extremely unremarkable iPhone photo with no clear subject or framing—just a careless snapshot. It includes part of a sidewalk, the corner of a parked car, a hedge in the background or other misc elements. The photo has a touch of motion blur, and mildly overexposed from uneven sunlight. The angle is awkward, the composition nonexistent, and the overall effect is aggressively mediocre—like a photo taken by accident while pulling the phone out of a pocket.
(這是一張極其普通、毫無特色的 iPhone 照片,看不出明確的主題或構圖——就像是隨手一拍的快照。畫面中可能包含一段人行道、一輛停著的車的車角、背景裡的綠籬,或其他雜亂的元素。照片有些輕微的運動模糊,陽光不均導致曝光略微過度。拍攝角度顯得尷尬,幾乎沒有構圖可言,整體效果平平無奇——就像是不小心從口袋裡掏手機時誤按快門拍下的一張照片。)
刻意的不完美:模糊、過曝、角度尷尬、構圖混亂,反而更貼近真實世界的樣子,要是你物件給你拍成這樣,免不了一頓捱罵,但讓 GPT-4o 生成卻是剛剛好。
隨著這段提示詞開始在 Reddit、X 等平臺刷屏,腦洞大開的網友也在此基礎上不斷加料:比如加入人物、特定景點,自拍角度等等,最終形成一套「真實假照片」的製作公式。
請你畫一張極其平凡無奇的 iPhone 自拍照,沒有明確的主體或構圖感–就像是隨手一拍的快照。照片略帶運動模糊,燈光不均導致輕微曝光過度。角度尷尬、構圖混亂,整體呈現出一種刻意的平庸感-就像是從口袋裡拿手機時不小心拍到的一張自拍。主角是「人物」,晚上,旁邊是「景點」。
附上更多 Reddit 網友的的實測結果:
向左滑動檢視更多內容
舉個例子,下面這張陽光灑進屋裡的照片,木地板的細節稍顯破綻,但灰塵、絨毛、陽光灑下的斑駁過曝感,都營造出一種真實的自然氛圍。
以至於用網友的調侃來說,「這張照片看起來像是我從我奶奶的老相機裡翻出來的。
除了在模擬物體(如風景、靜物、街頭場景)方面的效果尤為驚豔,比如生成的影像細節豐富、質感自然,足以以假亂真,這類提示詞生成人像的水平也不容小覷。
再看這張女生躺在草地上閉目養神的照片,陽光溫柔灑在臉上,閉目養神,神態鬆弛。如果沒有前文的鋪墊,你很難不相信這是朋友剛在林間草地上隨手拍下的一張照片。
但不好意思,這也是一張由 AI 生成的圖片。
甚至在 GPT-4o 的加持下,你只需一句話,就能對圖片「後期魔改」。原圖上一秒只有一個女人,下一秒就能在她的身旁憑空出現一位穿著印有「我的妻子不知道我在這裡」T 恤的丈夫。
當然,這段提示詞也不是沒有破綻。
模型傾向於生成訓練資料中最常見、最「安全」的變體,自然而然就會導致某種程度的視覺同質化。網友發現用這段提示詞生成汽車時,不指明品牌的情況下,生成的車幾乎都長一個樣,一眼看去毫無個性。
生成自拍女性影像時,如果沒有設定特定身份、五官、服裝,面部五官也常常「撞臉」。
向左滑動檢視更多內容
只需這份提示詞模板,GPT-4o 也能生成「拍不出來」的故事感?
細看上面這些照片,不難發現它們幾乎擁有一種「修不出來」的故事感。而沒有引數加持,也不靠後期修圖,CCD 相機同樣藉此翻紅。
前不久,「iPhone 5s 是 CCD 平替」的話題登上了熱搜,也讓這類審美趨勢再次走進了大眾視野。那麼能否用 GPT-4o 生成更具 CCD 風格的照片?我們做了一些嘗試,並總結出幾條實用的小技巧:
使用名人形象,模型訓練資料更豐富,還原度更高,更有真實感。
素人形象的一致性較弱,屬於「像又不像」,細看總有點違和。
調整圖片過程中,容易出現面部細節或背景元素的變形。
提示詞中加入 CCD 相機型號,能增強影像對應的氛圍與復古感。
提示詞模板如下:
[人物描述],穿著[服裝描述],[姿勢/動作],[場景位置],[光線描述],[背景元素],使用[CCD 相機型號]拍攝,開啟閃光燈,人物[清晰/明亮],背景[昏暗/模糊],顆粒感,[色調描述],[懷舊感/年代感],[風格型別]
室內風
向左滑動檢視更多內容
年輕女孩,長直髮自然蓬鬆,穿淺灰色修身長袖T恤和深藍色牛仔褲,坐在木質桌前,手持金屬杯子用吸管喝飲料,佩戴銀色戒指,姿勢慵懶自然,眼神直視鏡頭,表情輕鬆,背景是簡約暖色牆面和木質靠背,牆上有照片裝飾,室內昏暗光線,使用 CCD 相機(Sony DSC-W630)拍攝,開啟閃光燈,人物明亮,背景微暗,顆粒感,真實自然,生活化,復古隨拍風格
夜晚室外風
向左滑動檢視更多內容
圖片人物,黑色蓬鬆短髮,戴黑框圓眼鏡,穿灰色連帽衛衣搭配紅白格子襯衫和白色T 恤,背米色黑色拼接雙肩包,站在城市街道邊,輕鬆自然微笑,背景是黃昏時分的街道、行駛的車輛和高樓建築,天空漸變為藍色,環境偏暗,使用 CCD 相機(佳能 A650 IS)拍攝,閃光燈補光,人物明亮,背景自然昏暗,顆粒感,懷舊生活感,自然抓拍風格
街拍風
向左滑動檢視更多內容
圖片人物,穿著白色短袖 T 恤和牛仔褲,揹著黑色雙肩揹包,站在城市街道上,身體微微前傾,單手插兜,自然看向鏡頭,背景是車流和樹蔭大道,陽光透過樹葉灑下,街道乾淨寬闊,使用佳能 ixus6 相機拍攝,開啟閃光燈,人物明亮突出,背景動態模糊,顆粒感,真實自然,陽光少年感,日常街拍風
圖片人物,身穿白色 T 恤和牛仔褲,在街頭吹泡泡,泡泡在陽光下閃爍出彩虹光,表情專注又自然,街景模糊作為背景,CCD 風格(由 koda z700 拍攝),顆粒感,色調柔和偏暖,自然光
校園風
穿著校服的馬斯克站在操場邊,陽光斜照在臉上,頭髮隨風微微飄起,CCD 風格(由 koda z700 拍攝),色調偏暖,顆粒感,膠片質感,像是 2005 年拍的校園照片
自然風
圖片人物,身穿寬鬆毛衣站在岸邊,背對鏡頭望向遠方,身後是海上剛升起的太陽,整個畫面被金色晨光包裹,CCD 風格(由佳能 A650 IS 拍攝),輕微過曝,高對比光影,復古顆粒感,情緒感強烈
圖片人物,黃色連衣裙,白色長襪,草地野餐,陽光明媚,夏日氛圍,毛絨玩具熊,森林背景,CCD 風格(由 Sony DSC-W630 拍攝),高曝光,自然光感,清新懷舊,復古顆粒感
年輕男孩,黑色短髮,穿著深色毛衣,面朝鏡頭,站在湖邊,夕陽西下,金橘色天空,平靜水面和遠山背景,溫暖色調,使用 koda z700 拍攝,開啟閃光燈,人物清晰明亮,背景昏暗,顆粒感,懷舊感,清新少年風,真實自然,隨性抓拍
圖片人物,背景是海灘和海面,停泊著小船,天空多雲,戶外露臺場景,桌上有玻璃杯,傍晚光線昏暗,使用 CCD 相機(佳能 A650 IS)拍攝,開啟閃光燈補光,人物明亮,背景自然,顆粒感,懷舊真實風格
素人
向左滑動檢視更多內容
圖片人物,黑色短髮,穿著深色毛衣,面朝鏡頭,站在湖邊,夕陽西下,金橘色天空,平靜水面和遠山背景,溫暖色調,使用 koda z700 拍攝,開啟閃光燈,人物清晰明亮,背景昏暗,顆粒感,懷舊感,清新少年風,真實自然,隨性抓拍
圖片人物,黑色自然凌亂長髮,穿淺灰色寬鬆T恤和深色短褲,坐在室內地板上,手持一瓶酒,神情放鬆,微微側頭,眼神自然,背景是堆滿玩具、書籍、模型和音響的櫃子,室內暖色光,使用富士 F710 拍攝,閃光燈直打,人物明亮清晰,背景微暗,顆粒感,自然色調,懷舊生活感,自然抓拍風格
刻意製造「瑕疵」,才能騙過你的眼睛
早在 GPT-4o 用吉卜力風格刷屏那會兒,就有人發現它的另一種能力:生成假髮票。
創投人士 Deedy Das 就演示了一套流程:用模型生成賬單、發票,再疊加「汙漬」「褶皺」等細節,最終生成效果堪比復古做舊工藝。
對普通人來說,這類 AI 影像已經難以一眼識破。
除了相簿的引數可以作為真實圖片的佐證,作為廠商的 OpenAI 也會為 GPT-4o 所生成的圖片自動新增一種名為 C2PA 的元資料標準,雖然嵌入在影像畫素層中,不會被肉眼察覺,但可以透過特定演算法檢測。
即便影像被截圖、壓縮或改變尺寸,水印依然可以被追蹤識別。
諸如 Google、Adobe 也在積極推廣數字水印技術,用於標記和驗證 AI 生成內容。其目標是透過統一的水印和元資料標準,幫助使用者區分 AI 生成內容與非 AI 生成內容。
或許,在未來,我們更該警惕的不是那些看起來「像 AI」的圖片,而是那些看起來過於真實的瞬間。
而 GPT-4o 圖片的這種「真實」,其實也源自於人類創作本身的「瑕疵」。
OpenAI 等公司在訓練影像生成模型時,所依賴的資料大多采集自社交媒體、雲相簿或網路公開資源。這些影像原本就是我們日常生活的記錄,光線、構圖、裝置參差不齊,失誤和瑕疵也自然少不了。
透過學習這些「不完美」的樣本,AI 也就掌握瞭如何模模擬實世界中常見的攝影瑕疵。比如動態模糊模擬了手抖或物體移動,過曝光則還原了常見的翻車名場面。
OpenAI 官方並沒有公開 GPT-4o 生圖的具體原理,只是淡淡提了一嘴「不同於基於擴散模型的 DALL・E,4o 影像生成是一個嵌入在 ChatGPT 中的自迴歸模型。
相比傳統「先模糊再去噪」的擴散模型,自迴歸模型的學習方式就像是「按順序拼圖」:它需要逐步地預測每一個影像片段,也就是一格畫素、一塊特徵地猜接下來該是什麼。
這種逐格構建的方式,使它非常依賴於區域性上下文之間的合理性。
換句話說,如果模型看到「模糊+角度別 + 光線過曝」,它會自然聯想到這可能是一次手抖的抓拍。於是它在接下來的區域裡,也會接著模擬出相應的細節。
不是因為它「想畫得逼真」,而是因為它學會了這類圖通常就長這樣。
我們要求 AI 模擬這些「缺陷」時,實際上也是在啟用模型最熟悉、資料量最豐富的模式,最終,這種「真實感」就從語言層的描述,一筆一劃、逐步落實到畫素層的表達。
當然,具體實現的底層細節,還有待 OpenAI 進一步公開。
日本機器人專家森政弘(Masahiro Mori)在 1970 年提出了著名的「恐怖谷」理論:
當人造物(如機器人或 AI 影像)與人類的相似度接近某個臨界點時,那些微妙的「不協調」會引發觀者的生理不適與心理排斥感——它看起來「差不多像人」,卻不夠自然,從而讓人覺得怪異。
而一旦這種相似度跨越「谷底」,達到幾乎無法與真人區分的地步,觀者的好感才會再次回升。
AI 影像的典型「破綻」(如奇怪的六根手指、不合邏輯的光影、重複的紋理)往往都是 AI 在生成影像時經常露餡的地方,一旦被看出來,就會讓人瞬間出戲。
而反其道而行之,適當引入一些「人類特有的笨拙」,反而避開了早期生成影像常有的過於完美的違和感,也讓 AI 圖片顯得更真實、更親切。
或許,這也是 GPT-4o 在影像生成方面的一個轉折點:它不再執著於技術意義上的「完美」,而是試圖回到生活本真的模樣,學會用一點點「出戲」,換來一種「入戲」的真實。
而技術越發達,我們也似乎越懷念那些帶著瑕疵、卻更真實的瞬間。
習慣了手機/相機拍出高畫質大片,像廣告、像模板,但在影像無限趨於清晰的同時,是否那些不那麼清楚、不那麼完美的瞬間,才更接近生活本來的模樣?
文 | 素人
我們正在招募夥伴
📮 簡歷投遞郵箱[email protected]
✉️ 郵件標題「姓名+崗位名稱」(請隨簡歷附上專案/作品或相關連結)

相關文章