揭秘春晚AI黑科技!通義萬相新年甩出王炸,從全球榜首到春晚舞臺

登上春晚舞臺的通義萬相,有望引領影片生成賽道新趨勢。
作者 |  陳駿達
編輯 |  漠影
就在兩天前的除夕夜,一場科技感十足的春晚拉開帷幕,從臺前到幕後,中國科技的存在感讓人驚歎不已,頻頻衝上熱搜。時隔七年再度攜手央視春晚的阿里,更是獻上了從雲轉播到AI特效的科技大禮包。
甄子丹領銜的《筆走龍蛇》節目,運用了巴黎奧運同款的通義大模型AI技術,呈現出電影般的“子彈時間”畫面,讓觀眾享受到“空中環繞、時空凝結”等創新觀看體驗。
春晚每年的保留節目《難忘今宵》也得到了通義萬相影像編輯模型Wanx-ACE的支援,舞臺背景中變身為絢麗花燈的城市地標,便是由這款模型自動生成的。
2025年1月初,通義萬相模型迎來了重磅升級,推出了全新的2.1版本,影片生成與影像生成能力提升明顯,今年春晚中不少驚豔的視覺效果,也來自這款模型。
升級後的通義萬相不僅能處理複雜人物運動、遵循真實物理規律、匹配複雜提示詞,還能生成影視質感畫面,並首次實現了中文文字影片生成功能。
通義萬相2.1曾一度躍居影片生成權威評測框架VBench榜首,成為國內乃至全球影片生成模型的領跑者。
01.
拿捏中國風,AI讓創意走進現實
通義萬相2.1在本屆春晚中的參與可謂是全方位、全流程的,涵蓋從預告片到現場舞美等多個環節。
這款模型能準確理解多樣的藝術風格,為創意工作者提供了有力的創作工具,幫助他們將腦海中的想法變為現實。
對於中國風的內容,通義萬相可謂是手拿把掐。
在央視春晚預告片中,通義萬相文生圖讓中國非遺蘇繡煥發新生。萬相不僅成功捕捉了蘇繡的整體藝術風格,還將細節還原到每一根絲線,而每一副畫面的風格控制也較為穩定,最終給這項千年傳統技藝帶來了別開生面的呈現形式。
同款工具還在通義官網中上線,點選網站上放的“非遺刺繡”互動玩法,使用者就可以輸入文字,即刻生成一張刺繡圖。僅需等上幾秒鐘,便可生成一隻栩栩如生的刺繡鳳凰。
春晚舞臺上的諸多舞美效果也由通義萬相提供支援。
例如,央視春晚節目《方的言》舞臺背景的毛氈效果,便是由通義萬相的文生圖、圖生影片等技術實現。圖中的高樓、古建被轉化成了溫暖、柔和、立體的毛氈畫,與歌曲的主旨相得益彰。
在莫文蔚與毛不易合唱的《歲月裡的花》節目中,阿里通義萬相利用影像風格化和首尾幀影片生成技術,生成了沉浸式的油畫風舞美效果。
02.
央視春晚大放異彩,AI業內炙手可熱
除了登上央視春晚,給全球華人提供精彩的視覺效果外。大年初一,在AI業內1000餘名創作者參與的AI春晚中,通義萬相為三分之一的節目提供了技術支援,升級後的模型能更好地理解和模擬物理世界,最終為觀眾呈現了極佳的觀影體驗。
其中,取材自南宋畫家劉松年名畫《四景山水圖》的同名AI MV,一亮相便引來眾多網友的稱讚。
通義萬相顯著改善了困擾影片生成模型的幻覺問題,尤其是在涉及複雜肢體動作的畫面中。這類畫面可謂是影片生成模型的試金石,早期的影片生成模型可能會生成各種“辣眼睛”的結果,AI圈知名的鬼畜畫面“威爾·史密斯吃意麵”便是一個典型的失敗案例。
為處理此類動作,通義萬相團隊自研了高效的VAE和DiT架構,增強了模型的時空上下文建模能力,讓複雜的肢體運動、大幅度動作、鏡頭的移動都能穩定展現。
在AI MV《四景山水圖》中,通義萬相2.1完美地呈現了“擁爐對酒,折梅入瓶”的詩意畫面。畫面中人物的手型、持杯動作都十分自然,溫酒的熱氣蒸騰也得到不錯的還原。即便是處理折梅入瓶這樣細緻入微的動作時,通義萬相2.1也沒有出現翻車的情況。
在下方的畫面中,人物飲茶、放杯、合書、轉身的動作一氣呵成,運動軌跡流暢,人物與杯子、書本的互動也符合物理規律。
《四景山水圖》中的水墨畫風格鮮明,人物、花鳥傳神,還精準把握到了留白這一中國傳統藝術中的獨特審美理念,給觀眾以無限的想象空間。
在聯合網易雲音樂、W出品的《穿過大山》中,通義萬相同樣在人物動作上實現了較高的逼真度,外賣小哥整理頭盔的動作,手指和周邊物體也沒有出現重疊、變形等問題。
在涉及複雜運鏡效果時,通義萬相依舊穩定地生成高質量畫面。下圖中雖然鏡頭持續旋轉,但人物的五官都沒有出現明顯的形變。
03.
通義萬相新年多番王炸,
邁出影片生成模型落地重要一步
除了亮相央視春晚、AI春晚的眾多影片、影像生成技術之外,通義萬相新年還有多項其他領域的重磅升級。
通義萬相首次實現了中文文字影片生成功能,能在圖片與影片中準確呈現中文內容,而不是像大多數模型那樣僅能生成大致的輪廓。
此外,通義萬相還支援藝術字一鍵生成,文字還可以加上影片特效選項,如過渡、粒子效果、模擬等,視覺表現力超強。
文生組圖能力這次也登陸通義萬相,DiT架構增強了文生圖的上下文能力,可對多張影像進行拼接與聯合描述,輕鬆實現關聯影像間的組合生成,解鎖了通義萬相生成電影分鏡、四格漫畫、情侶頭像等高度關聯畫面的能力。
Prompt:一隻小狗在抓蝴蝶,撞到了一棵大樹上,眼冒金星。
縱觀通義萬相的全面能力升級和多項跨界合作,未來我們或許有望看到這款模型走進更多的應用場景,憑藉其迭代升級的影片質量、真實性,讓影片生成由AI公司秀肌肉的“角鬥場”真正轉變為能產生實際效益的生產力工具。
例如,影視製作團隊能用通義萬相快速生成多個備選方案,直觀展現視覺效果;也可以直接生成部分場景,極大地降低影視後期特效的成本。
電子商務場景裡,增強的影像與影片生成能力或許能用於宣傳品生成、AI試衣等環節,在提升消費體驗的同時還能降低成本。
而在藝術領域,通義萬相的風格化能力和複雜提示詞的理解能力,能幫助使用者快速生成具有特定風格的藝術作品,或是對自己原創的藝術作品進行高效的再創造、再利用,節省部分重複性勞動,讓創作者能專注於創意本身。
此外,通義萬相還具備簡潔直觀的互動介面,這意味著即便是非專業人士也能享受到這項技術的便利,顯著降低創作門檻,使更多普通使用者能夠輕鬆創作高質量的影片內容,滿足個性化需求。
例如,今年年初,通義萬相便聯合兩馬同春鬧元宵燈會,上線萬物變花燈功能,用圖生圖、文生圖、文生影片、圖生影片等能力,將福州各地的古建一鍵變化為精美的花燈,吸引不少個人使用者的體驗。
04.
結語:通義萬相躍居行業排頭兵,
引領影片生成賽道新趨勢
2023年春節期間,OpenAI憑藉Sora在影片生成領域引發熱潮,讓影片生成成為各大AI廠商競相追逐的焦點。而今年春節,阿里旗下的通義萬相在春晚這一全國矚目的舞臺上,展示了影片生成技術令人矚目的顯著進步。
通義萬相憑藉對真實物理規律的深度理解、複雜影視效果的完美呈現以及穩定清晰的輸出能力,幾乎滿足了人們對影片生成模型理想形態的全部期待。這款模型在落地場景時的積極探索和應用嘗試,更為影片生成賽道帶來了廣闊的想象空間,有望引領該領域的新趨勢。
(本文系網易新聞•網易號特色內容激勵計劃簽約賬號【智東西】原創內容,未經賬號授權,禁止隨意轉載。)


相關文章