2025 年 2 月 18 日,階躍星辰和吉利汽車集團聯合宣佈,將雙方合作的階躍兩款 Step 系列多模態大模型向全球開發者開源。其中,包含 目前全球範圍內參數量最大、效能最好的開源影片生成模型階躍 Step-Video-T2V(https://github.com/stepfun-ai/Step-Video-T2V),以及行業內首款產品級開源語音互動大模型階躍 Step-Audio(https://github.com/stepfun-ai/Step-Audio)。即日起可在躍問 APP 內體驗。
吉利汽車集團 CEO 淦家閱表示:“吉利致力成為智慧汽車 AI 科技的引領者和普及者,早在 2021 年,吉利就圍繞晶片、軟體作業系統、資料和衛星網搭建了端到端的自研體系和生態聯盟,構建了完善的‘智慧吉利科技生態網’,驅動使用者在智慧駕駛、智慧座艙上的體驗不斷進化。目前,吉利全棧自研的星睿 AI 大模型已經與階躍 Step-Video-T2V、Step-Audio 等大模型完成了深度融合,將為使用者帶來更智慧、更高階的座艙互動與智駕出行體驗,推動 AI 科技在智慧汽車領域的普及。”
據瞭解,這也是階躍星辰首次開源其 Step 系列基座模型。階躍星辰創始人、CEO 姜大昕博士表示:“階躍星辰一直以實現 AGI 為目標堅持研發基座大模型。我們深知 AGI 的實現離不開全球開發者的共同努力,開源的初心,一方面是希望跟大家分享最新技術成果,為開源社群貢獻一份力量;另一方面,我們相信多模態模型是實現 AGI 的必經之路,但目前尚處於早期階段,期待與社群開發者集思廣益,共同拓展模型技術邊界,並推動產業落地。”
階躍 Step-Video-T2V 是目前全球範圍內參數量最大、效能最好的開源影片生成大模型。階躍 Step-Video-T2V 模型的引數量達到 300 億,可以直接生成 204 幀、540P 解析度的高質量影片,這意味著能確保生成的影片內容具有極高的資訊密度和強大的一致性。
從生成效果來看,階躍 Step-Video-T2V 在複雜運動、美感人物、視覺想象力、基礎文字生成、原生中英雙語輸入和鏡頭語言等方面具備強大的生成能力,且語義理解和指令遵循能力突出,能夠高效助力影片創作者實現精準創意呈現。使用者可以在躍問網頁端和躍問 App 上體驗階躍 Step-Video–T2V 的影片生成能力 。
為了對開源影片生成模型的效能進行全面評測,階躍星辰還發布並開源了針對文生影片質量評測的新基準資料集 Step-Video-T2V-Eval。該測試集包含 128 條源於真實使用者的中文評測問題,旨在評估生成影片在運動、風景、動物、組合概念、超現實、人物、3D 動畫、電影攝影等 11 個內容類別上質量。

Step-Video-T2V-Eval 評測結果
評測結果顯示,階躍 Step-Video-T2V 的模型效能在指令遵循、運動平滑性、物理合理性、美感度等方面的表現,均顯著超過市面上既有的效果最佳的開源影片模型。
據瞭解,目前在 躍問網頁端 和躍問 App 上,都可以體驗 階躍 Step-Video-T2V 的影片生成能力 。
據階躍星辰介紹,這款階躍 Step-Audio 是行業內首個產品級的開源語音互動模型,能夠根據不同的場景需求生成情緒、方言、語種、歌聲和個性化風格的表達,能和使用者自然地高質量對話。模型生成的語音具有超自然、高情商等特徵,同時也能實現高質量的音色復刻並進行角色扮演,滿足影視娛樂、社交、遊戲等行業場景下應用需求。

在 LlaMA Question、Web Questions 等 5 大主流公開測試集中,階躍 Step-Audio 模型效能均高於行業內同類型開源模型,取得了最高得分。階躍 Step-Audio 在 HSK-6(漢語水平考試六級)評測中的表現尤為突出,是更懂中國話的開源語音互動大模型。

StepEval-Audio-360 基準測試
此外,由於目前行業內語音對話測試集相對缺失,階躍星辰自建並開源了多維度評估體系 StepEval-Audio-360 基準測試,從角色扮演、邏輯推理、生成控制、文字遊戲、創作能力、指令控制等 9 項基礎能力的維度對開源語音模型進行全面測評。透過人工橫評後的結果顯示,階躍 Step-Audio 的模型能力十分均衡,且在各個維度上均超過了此前市面上效果最佳的開源語音模型。
2 月 11 日至 2 月 27 日,AI 前線影片號、InfoQ 影片號、霍太穩影片號帶來 DeepSeek 系列直播,解析 DeepSeek 爆火背後的技術突破、商業化路徑與行業影響。從 純強化學習復現 o1 能力到算力控制,從創新文化到 AI 競爭格局,每場直播都深度解析一個關鍵問題。

在 AI 大模型技術如洶湧浪潮席捲軟體開發領域的當下,變革與機遇交織,挑戰與突破共生。2025 年 4 月 10 – 12 日,QCon 全球軟體開發大會將在北京召開,以 “智慧融合,引領未來” 為年度主題,匯聚各領域的技術先行者以及創新實踐者,為行業發展撥雲見日。現在報名可以享受 8 折優惠,單張門票立省 1360 元,詳情可聯絡票務經理 18514549229 諮詢。
