
編輯 | 楊文、劉欣
AI 影片圈從不缺「神仙打架」。
上週,快手可靈剛釋出了 2.0 模型,號稱是史上最強視覺模型;昨天,生數科技就上線了全新影片模型 Vidu Q1。
它不僅能直出 1080P 電影級高畫質影片:

還能透過首尾幀功能實現大師級運鏡:

同時動畫生成效果也再上一個 level:

據影片生成模型權威測評基準 VBench-1.0 以及 VBench-2.0 剛剛釋出的測評結果,Vidu Q1 在 VBench 系列的兩個榜單上都超越了 Runway 、OpenAI Sora、快手的 Kling 等國內外頂尖模型,拿下文生影片賽道榜單雙第一。
![]() |
![]() |
此外在國內權威大模型測評機構 SuperCLUE 的圖生影片榜中,Vidu Q1 也在動漫風格、寫實風格上斬獲雙榜單第一的成績。

目前 Vidu Q1 已全球同步上線,無需邀請碼,開啟 App 和網頁即可體驗,而且每秒生成價格最低僅需 0.3 元。
連結直達:https://www.vidu.cn/
Vidu Q1 實力到底如何,我們直接上手實測一波。
-1-
高畫質畫質、電影質感
此次釋出的 Vidu Q1,在文生影片和圖生影片上均支援 1080P 高解析度,無論是宏大的科幻敘事還是人物特寫的細微表情,都可以清晰呈現。
提示詞:富士膠片 Portra 400H 靜態照片,急馳的日產天際線 R33 GTR LM JGTC,大幅度運動效果,東京 7-11 便利店,午夜時分。

午夜的街道、跑車的極速漂移都生成得相當逼真,即使是大幅度運動畫面也沒崩。
提示詞:一位衝浪者在波濤洶湧的大海中駕馭巨浪,陽光透過浪花灑在衝浪者的身上,水花四濺,展現出勇敢和挑戰自我的精神。

Vidu Q1 精準地模擬了波浪起伏,男子衝浪時的快速移動也很絲滑,沒有任何卡頓或模糊。
提示詞:一位街頭小提琴手在雪花飄落的寧靜歐洲廣場上演奏,雪花落在她的髮間,身後是燭光映照的窗戶。

Vidu Q1 嚴格遵循了文字描述,「雪花飄落」、「燭光映照的窗戶」等細節它都生成得很到位,而且女生拉小提琴時手指動作流暢自然,完全沒有出現缺失或多餘的手指問題。
-2-
動畫風格
一直以來,Vidu 最讓人稱道的就是動畫效果。
不管是類似新海誠,宮崎駿,大友克洋風格的日本動畫,還是類似迪斯尼、皮克斯、彼得·道格特風格的美國動畫,Vidu 都能穩定輸出。
而這次上線的 Q1,相比於前一版本又有了大幅提升,支援更加多元風格的影片輸出。
提示詞:動漫風格,一個男孩在鄉村小徑上騎腳踏車,兩旁是野花與高大的樹木,遠處可見有著木質房屋的小村莊,陽光明媚,氛圍寧靜而歡快。

提示詞:一個充滿魔法氣息的森林,地上開滿了會發光的奇異花朵,天空中飄著彩色的泡泡。一位穿著精靈服裝的少女站在畫面中央,她有著大大的眼睛和尖尖的耳朵,正好奇地伸手,周圍的一切都顯得夢幻而神秘。

提示詞:一隻可愛的松鼠從樹洞裡掏出松果,想吃掉松果。

X 網友 Naegiko 使用 Vidu Q1 製作了一則集合多種風格的短片,效果相當驚豔,尤其是對動漫人物面部表情的處理,甚是靈動。
https://x.com/naegiko/status/1914424072341217788
-3-
大師級運鏡
這次 Vidu Q1 的首尾幀功能也再次升級,僅需兩張圖,不僅能生成推拉搖移等各種鏡頭,還能自動腦補出電影質感的完整片段。
比如我們上傳這兩張圖,分別作為首幀和尾幀:

連提示詞都不用寫, Q1 直接讓馬斯克變身鋼鐵俠,效果相當酷炫。

再比如下面這個例子,同樣上傳首尾幀,無需提示詞,宇航員身上就長出了五顏六色的花朵。


此外,Q1 還能生成一系列高運動鏡頭。提示詞只簡單要求推進鏡頭,Q1 就能在鏡頭不斷推進的過程中,讓主角轉個身逐漸露出側臉。


下面這個影片也是如此。首幀是一張海邊懸崖的圖片,尾幀是一張輪船在海上航行的圖片,然後 Q1 自動生成右移鏡頭,將兩幅圖片絲滑銜接在一起。
![]() |
![]() |

-4-
告別無聲電影
Q1 模型釋出同時,Vidu 還推出了文生音效模型。只需一句話,即可生成最長 10 秒的專屬音效。
這也意味著,Vidu 打通了影片創作的整個工作流,從影片生成到音效生成,一個平臺就能搞定。
具體來說,該模型有三大技術創新亮點。
首先,使用者可以精準控制生成音效的時間,音效可以在 10 秒內的任意時間點開始生成。這也是目前為止業內商業領域首個支援精細化時間控制的文生音效系統。
比如 0s-4s 海浪拍打礁石、4s-6s: 輪船鳴笛:
其次,Vidu 的文生音效功能還支援多段音效疊加,並以一個完整的音訊檔案輸出。例如,下面的示例中,透過多段音效的疊加,成功還原了火車經過的真實感。
或者是人聲鼎沸的熱鬧集市:
最後,相比於業內普遍只能生成 16KHz 或者 32KHz,Vidu 的音效已經可以做到 48KHz 的音樂級取樣率和保真度,這也是文生音效在商業化領域中首家做到 48KHz 的高保真音效。
我們還可以用 Vidu 的文生音效功能探索更多玩法,比如生成一段搖滾樂:
總體來說,Vidu Q1 的優勢不僅在於高畫質畫質和穩定的影片表現,還在於為創作者提供了一套完整的影片創作解決方案。從 1080P 高畫質影片生成、多風格動畫渲染、專業級運鏡,再到全新的文生音效功能,Vidu 幾乎覆蓋了影片創作的全部環節。
同時,每秒生成成本低至 0.3 元的定價策略,僅為同行的十分之一,這也為個人創作者和中小企業提供了更經濟實惠的選擇。
大家快去 Vidu 網站和 Vidu 手機端體驗一波吧。
© THE END
轉載請聯絡本公眾號獲得授權
投稿或尋求報道:[email protected]