20萬+圍觀GPT-4o整出Gif！我們玩出新高度

編輯 | Sia

這屆網友真是把 AI 玩出花！繼谷歌 Gemini 2.0 Flash 去水印騷操作後，Reddit 社群的老哥們又用 GPT-4o 解鎖動畫製作新姿勢——直接生成動畫關鍵幀。只需簡單指令，模型直接吐出連貫動作序列幀，絲滑程度堪比動畫師原畫。

受此啟發，另位網友獻上進階玩法：對提示詞稍加潤色，再將 GPT-4o 生成的一系列關鍵幀直接整成了 GIF 動圖。推文一齣，立刻狂攬 20 萬+圍觀。

提示詞模版：

建立一個詳細的畫素藝術幀動畫，用於遊戲，其中最終影像被分成多個子影像，每個子影像作為一個連續的動畫關鍵幀。設計序列以描繪[一個巫師施法：從複雜的手勢開始，然後展示巫師召喚一個鮮豔的火球，最後捕捉施放火球的瞬間。]確保關鍵幀之間平滑而連續地過渡，並儘可能包含多個幀，以實現高水平的流暢性和細節。

網友們也不閒著，陸續整活兒。

日出既視感。

不斷變身的小動物和武術。

話說這些活兒算不上好玩，我們決定親自整幾齣。

韓國大明星金秀賢深陷與未成年女星交往風波，近期記者招待會上精彩演出，被網友用 AI 整成了喜劇：

我們配了個動圖，不忘 BGM： You are my destiny。

最驚訝的是做了個馬蒂斯風格的藝術動圖，這效果也太好了吧！

提示語：建立一個馬蒂斯風格的藝術動畫，最終影像被分成多個子影像，每個子圖都是連續動畫關鍵幀，請描繪一位貴婦被嚇得大吃一驚的過程：一位貴婦面對著鏡頭，然後臉上露出不安的表情，接著眼睛瞪大，嘴巴張開，捕捉最後目瞪口呆瞬間。請確保關鍵幀過渡流暢且連續，幷包含儘可能多的幀，以實現動畫的高流暢度和細節。人物應在每一幀中保持居中，所有幀大小相等，並完美排列在一個 nxn 的網格中，形成單張影像。

宮崎駿風格的小女孩 wink，隨手拈來！

建立一個吉卜力風格藝術動畫，最終影像被分成多個子影像，每個子圖都是連續動畫關的鍵幀，請描繪一個女孩兒轉頭對著鏡頭wink的過程：女孩兒背對鏡頭，披肩長髮；然後轉過頭，對著鏡頭，微笑，最後捕捉對著鏡頭wink瞬間。請確保關鍵幀過渡流暢且連續，幷包含儘可能多的幀，以實現動畫的高流暢度和細節。人物應在每一幀中保持居中，所有幀大小相等，並完美排列在一個nxn的網格中，形成單張影像。哪怕只有 4 張關鍵幀，效果也不錯！

當然，幀圖越多，效果越細膩。

建立一個畫素風格的藝術動畫，最終影像被分成多個子影像，每個子圖都是連續動畫關的鍵幀，描繪一個女孩兒尬舞的過程：面對鏡頭，開始扭動臀部，左右扭動，手舞足蹈。請確保關鍵幀過渡流暢且連續，幷包含儘可能多的幀，以實現動畫的高流暢度和細節。人物應在每一幀中保持居中，所有幀大小相等，並完美排列在一個nxn的網格中，形成單張影像。兩隻皮克斯風格的加菲貓，一開始還挺友好，後來怒到毛都豎起來，想要互毆。即使畫面出現兩個主體，有一定動作互動，也沒問題。

建立一個皮克斯風格藝術動畫，最終影像被分成多個子影像，每個子圖都是連續動畫關鍵幀，請描繪兩隻加菲貓敵視對方，要打架的過程：兩隻貓對視，接著露出兇狠表情，身上的毛豎起來、尾巴豎起來，最後捕捉要打架的瞬間。請確保關鍵幀過渡流暢且連續，幷包含儘可能多的幀，以實現動畫的高流暢度和細節。動物應在每一幀中保持居中，所有幀大小相等，並完美排列在一個nxn的網格中，形成單張影像。話不多說，下面介紹整活方法。

-1-

最傻瓜的方式

最簡單的辦法就是全部在 GPT-4o 裡完成。

你問平替？木有的。豆包、谷歌 Imagen 都試過，不僅很難生成有邏輯順序的系列幀，影像一致性也夠嗆，更別說直接在對話中生成動圖。以金秀賢的動圖為例。輸入提示：生成一張包含 9 個精靈幀的影像網格，描述一個男演員在記者會上，一邊哭一邊吃漢堡喝水的樣子，吉卜力藝術風格。所謂精靈幀（ Sprite Frame），是一個遊戲和動畫開發技術術語，可以理解為一系列靜態影像或幀，這些影像快速地連續播放，會產生動畫效果。

不用抽卡，一次搞定：

繼續輸入：先檢測照片的大小，然後合理裁剪這張照片，最後完成初步對齊匹配之後，將這張照片生成一個 gif 動畫。立刻就有了結果。

就是這樣：

-2-

更精細的方法

如果你仔細觀察上面的九宮格，會發現兩個比較明顯的問題。首先，第三張圖明顯不合理——一隻手捂著臉，還有兩隻手拿著漢堡。其次，關鍵幀的邏輯順序需要再調整，比如吃漢堡的過程；水杯裡的水應該是從多變少。所以，想要動圖效果更好，我們需要一些可以編輯這些圖片的工具。介紹兩個簡單好用的：一個是負責裁剪生圖的 Image Splitter ：

https://miniwebtool.com/image-splitter/一個是負責將切片組成動圖的 GIF Maker ：

https://miniwebtool.com/gif-maker/我們將 GPT-4o 生成的九宮圖上傳到 Image Splitter ，然後裁成九張圖片。

匯入 GIF Maker。去掉有三隻手的生圖，並調整圖片的順序。你還可以選擇合適的幀率（我一般選 500 左右，或者更低延遲），延遲越高，動圖越緩慢；反之，則越快。還能調整畫質和尺寸。

看看編輯後的動圖效果，是不是明顯更合理了？

再做個火柴人風格藝術動畫。提示語：建立一個火柴人風格藝術動畫，最終影像被分成多個子影像，每個子圖都是連續動畫關鍵幀，請描繪一個人躺在地上默默流淚：一個男孩躺在地上，接著眼睛開始流出淚水；眼淚越來越多，逐漸在臉上流程兩條小河；最後捕捉到淚水留到地面的瞬間。請確保關鍵幀過渡流暢且連續，幷包含儘可能多的幀，以實現動畫的高流暢度和細節。人物應在每一幀中保持居中，所有幀大小相等，並完美排列在一個 nxn 的網格中，形成單張影像。稍微解釋下，這個提示詞意味著，我們將究竟生成多少張幀圖才能實現畫面流暢的問題直接扔給了大模型。你對幀圖的邏輯內容描述越細緻，生成結果的可控性就會更好。

另外，考慮到後面自動剪裁的便利性，需要在提示詞中明確要求：所有幀大小相等，並完美排列在一個 nxn 的網格中：

剪裁完了，刪掉明顯影響效果的幀圖（但不要太多），再調整它們的位置，以求效果最好。

我們想要一個描繪小船在梵高星月夜裡遊動的動畫，系統自動生成了 16 宮格。

-3-

一個意外

在尋找平替的過程中，突然想到谷歌 AI studio 裡有 Storyboard，它本身就有圖文並茂的能力，能不能生成系列幀呢？關鍵是免費，如果可以湊合用，也不錯啊。提示詞：建立一個吉卜力風格的藝術動畫，最終影像被分成多個子影像，每個子影像作連續的動畫關鍵幀，設計一個序列描繪公主施法的過程，先從公主的手部動作開始，然後展示公主變出一個充滿活力的火球，最後捕捉施放火球的瞬間。請確保關鍵幀過渡流暢且連續，幷包含儘可能多的幀，以實現動畫的高流暢度和細節。很意外，一共生成了九張圖，圖與圖之間邏輯還挺合理。