吉卜力只是開胃小菜,GPT-4o一鍵摳圖「換裝換背景」!推理也初步顯現

機器之心報道
編輯:大盤雞、杜偉
這幾天,你要說 AI 圈最火的是哪個模型?OpenAI 的 GPT-4o 當仁不讓。
吉卜力風格的影像和影片在社交圈瘋傳,被玩出了花。之心用 GPT-4o 和可靈做出了吉卜力版《甄嬛傳》全網播放超 20w。
除了一些口型和神情還有出入,人物形象可謂是超絕還原。
X 平臺上的網友利用 GPT-4o 和 Luma Ray 2,把《瘋狂的麥克斯》動畫版也做出來了。
在網友探索 AI 動畫生成的同時,還有一個功能被刨了個底朝天。在 OpenAI 的釋出介紹中壓根沒提,但非常有用的功能 —— 畫筆編輯。
沒錯,就是這麼一塗,你就能變身造物主,想怎麼改圖就怎麼改圖。
我們趕緊上手試了一下,發現效果真的很強!
把同事的照片轉換成吉卜力風格後,點選生成的圖片,右上方有一個畫筆按鈕,輕點之後就能進入到畫板介面。

塗抹需要修改的部分,然後輸入相關的 prompt,例如這張圖裡,我們輸入了「移除外套只保留裡面那件短袖」。

於是,一張保留了大量原圖細節的脫去外套版圖片就生成了。

不過,原圖與新圖之間還有一定差別。後面背景中石頭和植被的佈置以及人物的表情都發生了變化。不過整體細節相對保留完整,GPT-4o 也能夠理解我們的指令。
還能換背景哦,下面這張圖就把背景換成了小溪。

換個同事的童年照片,給她加頂海盜帽也是非常好用。

不過,複雜一些的轉換看起來效果還不算完美。例如這個彌補了《大話西遊》中至尊寶和紫霞仙子遺憾結局的換位。猴子腦袋快被金箍勒爆了,身體也沒有被雲霧覆蓋。但是人物的細節和風格都保持住了。
推理與非推理集於一身,GPT-5 要來了?
在刷爆影像生成的同時,GPT-4o 還有了另一個重大發現:現在可以顯示推理時間與思維鏈過程了。
這不禁令人聯想,難道 OpenAI 開始合併推理與非推理模型了?正如奧特曼上個月提到的那樣,OpenAI 計劃統一 o 系列與 GPT 系列模型,構建可以自主判斷任務需求的智慧系統,不用再每次選擇模型。

還有使用者曬出了自己 2024 年底的截圖,這可能意味著 OpenAI 並不是最近才開始測試,GPT-4o 的推理能力也持續很長時間了(6 個月以上)。

截圖如下:

對此,以上兩位使用者展開了討論,前一位表示現在的推理看起來比去年更長更好了。後一位稱,這只是反映了 OpenAI 如何輸出「推理」過程,可以看到過去是兩種方式,與 o1 相同。而最近 o1、o3 與 4o 的推理看起來不一樣了,非推理模型中開始出現推理了。

這並不是個例,越來越多人發現了 GPT-4o 的推理現象。

不過有人懷疑是不是 bug。即使是 bug,也許是非常有趣的 bug。

正如下面這位網友所說,看起來我們正在即時觀察 GPT-5 的啟動,模型版本之間的界限正在迅速模糊併合並。

© THE END 
轉載請聯絡本公眾號獲得授權
投稿或尋求報道:[email protected]

相關文章