揭秘春晚AI黑科技！通義萬相新年甩出王炸，從全球榜首到春晚舞臺

登上春晚舞臺的通義萬相，有望引領影片生成賽道新趨勢。

作者 | 陳駿達

編輯 | 漠影

就在兩天前的除夕夜，一場科技感十足的春晚拉開帷幕，從臺前到幕後，中國科技的存在感讓人驚歎不已，頻頻衝上熱搜。時隔七年再度攜手央視春晚的阿里，更是獻上了從雲轉播到AI特效的科技大禮包。

甄子丹領銜的《筆走龍蛇》節目，運用了巴黎奧運同款的通義大模型AI技術，呈現出電影般的“子彈時間”畫面，讓觀眾享受到“空中環繞、時空凝結”等創新觀看體驗。

春晚每年的保留節目《難忘今宵》也得到了通義萬相影像編輯模型Wanx-ACE的支援，舞臺背景中變身為絢麗花燈的城市地標，便是由這款模型自動生成的。

2025年1月初，通義萬相模型迎來了重磅升級，推出了全新的2.1版本，影片生成與影像生成能力提升明顯，今年春晚中不少驚豔的視覺效果，也來自這款模型。

升級後的通義萬相不僅能處理複雜人物運動、遵循真實物理規律、匹配複雜提示詞，還能生成影視質感畫面，並首次實現了中文文字影片生成功能。

通義萬相2.1曾一度躍居影片生成權威評測框架VBench榜首，成為國內乃至全球影片生成模型的領跑者。

01.

拿捏中國風，AI讓創意走進現實

通義萬相2.1在本屆春晚中的參與可謂是全方位、全流程的，涵蓋從預告片到現場舞美等多個環節。

這款模型能準確理解多樣的藝術風格，為創意工作者提供了有力的創作工具，幫助他們將腦海中的想法變為現實。

對於中國風的內容，通義萬相可謂是手拿把掐。

在央視春晚預告片中，通義萬相文生圖讓中國非遺蘇繡煥發新生。萬相不僅成功捕捉了蘇繡的整體藝術風格，還將細節還原到每一根絲線，而每一副畫面的風格控制也較為穩定，最終給這項千年傳統技藝帶來了別開生面的呈現形式。

同款工具還在通義官網中上線，點選網站上放的“非遺刺繡”互動玩法，使用者就可以輸入文字，即刻生成一張刺繡圖。僅需等上幾秒鐘，便可生成一隻栩栩如生的刺繡鳳凰。

春晚舞臺上的諸多舞美效果也由通義萬相提供支援。

例如，央視春晚節目《方的言》舞臺背景的毛氈效果，便是由通義萬相的文生圖、圖生影片等技術實現。圖中的高樓、古建被轉化成了溫暖、柔和、立體的毛氈畫，與歌曲的主旨相得益彰。

在莫文蔚與毛不易合唱的《歲月裡的花》節目中，阿里通義萬相利用影像風格化和首尾幀影片生成技術，生成了沉浸式的油畫風舞美效果。

02.

央視春晚大放異彩，AI業內炙手可熱

除了登上央視春晚，給全球華人提供精彩的視覺效果外。大年初一，在AI業內1000餘名創作者參與的AI春晚中，通義萬相為三分之一的節目提供了技術支援，升級後的模型能更好地理解和模擬物理世界，最終為觀眾呈現了極佳的觀影體驗。

其中，取材自南宋畫家劉松年名畫《四景山水圖》的同名AI MV，一亮相便引來眾多網友的稱讚。

通義萬相顯著改善了困擾影片生成模型的幻覺問題，尤其是在涉及複雜肢體動作的畫面中。這類畫面可謂是影片生成模型的試金石，早期的影片生成模型可能會生成各種“辣眼睛”的結果，AI圈知名的鬼畜畫面“威爾·史密斯吃意麵”便是一個典型的失敗案例。

為處理此類動作，通義萬相團隊自研了高效的VAE和DiT架構，增強了模型的時空上下文建模能力，讓複雜的肢體運動、大幅度動作、鏡頭的移動都能穩定展現。

在AI MV《四景山水圖》中，通義萬相2.1完美地呈現了“擁爐對酒，折梅入瓶”的詩意畫面。畫面中人物的手型、持杯動作都十分自然，溫酒的熱氣蒸騰也得到不錯的還原。即便是處理折梅入瓶這樣細緻入微的動作時，通義萬相2.1也沒有出現翻車的情況。

在下方的畫面中，人物飲茶、放杯、合書、轉身的動作一氣呵成，運動軌跡流暢，人物與杯子、書本的互動也符合物理規律。

《四景山水圖》中的水墨畫風格鮮明，人物、花鳥傳神，還精準把握到了留白這一中國傳統藝術中的獨特審美理念，給觀眾以無限的想象空間。

在聯合網易雲音樂、W出品的《穿過大山》中，通義萬相同樣在人物動作上實現了較高的逼真度，外賣小哥整理頭盔的動作，手指和周邊物體也沒有出現重疊、變形等問題。

在涉及複雜運鏡效果時，通義萬相依舊穩定地生成高質量畫面。下圖中雖然鏡頭持續旋轉，但人物的五官都沒有出現明顯的形變。

03.

通義萬相新年多番王炸，

邁出影片生成模型落地重要一步

除了亮相央視春晚、AI春晚的眾多影片、影像生成技術之外，通義萬相新年還有多項其他領域的重磅升級。

通義萬相首次實現了中文文字影片生成功能，能在圖片與影片中準確呈現中文內容，而不是像大多數模型那樣僅能生成大致的輪廓。

此外，通義萬相還支援藝術字一鍵生成，文字還可以加上影片特效選項，如過渡、粒子效果、模擬等，視覺表現力超強。

文生組圖能力這次也登陸通義萬相，DiT架構增強了文生圖的上下文能力，可對多張影像進行拼接與聯合描述，輕鬆實現關聯影像間的組合生成，解鎖了通義萬相生成電影分鏡、四格漫畫、情侶頭像等高度關聯畫面的能力。

Prompt：一隻小狗在抓蝴蝶，撞到了一棵大樹上，眼冒金星。

縱觀通義萬相的全面能力升級和多項跨界合作，未來我們或許有望看到這款模型走進更多的應用場景，憑藉其迭代升級的影片質量、真實性，讓影片生成由AI公司秀肌肉的“角鬥場”真正轉變為能產生實際效益的生產力工具。

例如，影視製作團隊能用通義萬相快速生成多個備選方案，直觀展現視覺效果；也可以直接生成部分場景，極大地降低影視後期特效的成本。

電子商務場景裡，增強的影像與影片生成能力或許能用於宣傳品生成、AI試衣等環節，在提升消費體驗的同時還能降低成本。

而在藝術領域，通義萬相的風格化能力和複雜提示詞的理解能力，能幫助使用者快速生成具有特定風格的藝術作品，或是對自己原創的藝術作品進行高效的再創造、再利用，節省部分重複性勞動，讓創作者能專注於創意本身。

此外，通義萬相還具備簡潔直觀的互動介面，這意味著即便是非專業人士也能享受到這項技術的便利，顯著降低創作門檻，使更多普通使用者能夠輕鬆創作高質量的影片內容，滿足個性化需求。

例如，今年年初，通義萬相便聯合兩馬同春鬧元宵燈會，上線萬物變花燈功能，用圖生圖、文生圖、文生影片、圖生影片等能力，將福州各地的古建一鍵變化為精美的花燈，吸引不少個人使用者的體驗。

04.

結語：通義萬相躍居行業排頭兵，

引領影片生成賽道新趨勢

2023年春節期間，OpenAI憑藉Sora在影片生成領域引發熱潮，讓影片生成成為各大AI廠商競相追逐的焦點。而今年春節，阿里旗下的通義萬相在春晚這一全國矚目的舞臺上，展示了影片生成技術令人矚目的顯著進步。

通義萬相憑藉對真實物理規律的深度理解、複雜影視效果的完美呈現以及穩定清晰的輸出能力，幾乎滿足了人們對影片生成模型理想形態的全部期待。這款模型在落地場景時的積極探索和應用嘗試，更為影片生成賽道帶來了廣闊的想象空間，有望引領該領域的新趨勢。

（本文系網易新聞•網易號特色內容激勵計劃簽約賬號【智東西】原創內容，未經賬號授權，禁止隨意轉載。）

dignews.cc

揭秘春晚AI黑科技！通義萬相新年甩出王炸，從全球榜首到春晚舞臺

相關文章

單張3090讓大模型“看”《黑悟空》，港大百度釋出VideoRAG

如何利用文字提示高效生成高質量、個性化的長影片？

單卡3090幫你一口氣看完《黑悟空》，港大百度打造超長影片理解引擎VideoRAG

網友驚呆了！！！阿里通義萬相大模型逆天了，怎麼生成這種影片的！！！

當義烏老闆開始用DeepSeek賺錢……

DS豆包通義BTY王炸組合，我做了個元宵AI影片小程式

ICLR2025|谷歌&港大提出SVG：基於擴散模型的雙目影片生成

太貴了！！！一個月200美元！！！OpenAI上線A影片生成模型Sora！！！

可靈2.0成“最強視覺生成模型”？自稱遙遙領先OpenAI、谷歌，技術創新細節大揭秘！

中科聞歌釋出智川X-Agent平臺、優雅音影片大模型更新，領先技術加速AI普惠落地