

作者 | 程茜
編輯 | 漠影
智東西7月25日報道,在世界人工智慧大會正式開幕前一天,階躍星辰在釋出會上接連放出一系列重磅訊息。
首先,階躍釋出新一代主力基座模型Step 3,並宣佈將於7月31日面向全球企業和開發者開源,為開源世界貢獻最強多模態推理模型。Step 3的野心是打造推理時代最適合應用的模型,實現了行業領先的推理解碼效率。它在國產晶片上的推理效率最高可達DeepSeek-R1的300%,且對所有晶片友好。
這也引出了第二個重磅,階躍宣佈聯合近10家晶片及基礎設施廠商,共同發起“模芯生態創新聯盟”,致力於透過底層聯合創新提升大模型適配性和算力效率,加速大模型應用落地,包括華為昇騰、沐曦、壁仞科技、燧原科技、天數智芯、無問芯穹在內的多家頂級國產晶片大佬罕見地在階躍釋出會同臺亮相。
與基礎大模型能力進階同頻的,是階躍星辰在大模型商業化應用落地上勢如破竹——根據官方披露的資料,2025年上半年,階躍星辰的收入快速增長,全年收入預計接近10億元。
階躍星辰創始人、CEO姜大昕談道,隨著大模型進入到強化學習發展階段,新一代推理模型成為主流,模型效能的提升固然顯著,但這是否完全等同於模型價值?什麼樣的推理模型是最適合商業化應用的?如何聯動模型、晶片、基礎設施全技術鏈條的力量,一起加速大模型的應用落地?基礎大模型公司如何透過技術創新找到健康可持續的商業化路徑?
階躍在這場釋出會對這一系列問題交出了有行業啟發性的答卷。
01.
多榜單超主流開源模型
推理效率可達DeepSeek-R1 300%
推理模型已然成為今年大模型產業的熱詞。
但當下推理模型的可用性仍被多重現實瓶頸制約:能支撐其流暢執行的高效能晶片供給有限,多數企業面臨模型跑得起卻用不起的算力困境;開源生態的不完善讓技術迭代受限,閉源模式下使用者既難驗證推理邏輯的可靠性,也難以針對場景深度調優;更關鍵的是,大量推理模型仍困於單一模態的“資訊孤島”,缺乏兼具文字、影像、影片、語音的綜合多模態能力,難以應對真實世界的複雜互動需求。
但如今能同時處理文字、影像、音訊、影片、感測器資料等多種模態資訊,並進行跨模態理解與推理的多模態推理模型,其重要性正隨著技術發展和應用深化愈發凸顯。
這一背景下,階躍星辰新一代多模態推理旗艦模型Step 3應運而生。 Step 3是階躍星辰首個全尺寸、原生多模態推理模型,兼顧模型效果與推理成本,是在模型架構創新、演算法工程協同設計上的一次大膽嘗試與Scale Up。Step 3採用MoE架構,總引數量321B,啟用引數量38B。
在現場,Step 3模型透過我們常見的色盲測試接受了感知能力考驗,模型準確識別出了圖形中隱藏的“STEP3”,並且還在推理過程中提到“它知道自己也叫Step 3,這可能是一個有趣的巧合”。
▲色盲測試
下一個難題面臨的場景更為複雜。一份包含多人在微信群裡有討論購買零食和酒水的聊天記錄,還有一份購買的小票,Step 3需要結合小票和聊天記錄,最後算出群裡的成員如何分賬。Step 3就可以快速理清如何分賬,將視覺和推理能力相結合,最後算出每個人要出的總價格。
與人工計算結果相比,Step 3的答案僅有0.03元差異,是由於四捨五入的規則不同導致的。
推理時代讓模型可用的先決條件擴充套件到了多模態、夠聰明。
Step 3作為多模態推理模型,具備視覺感知和複雜推理能力,可完成跨領域的複雜只是理解、數學與視覺資訊的交叉分析、日常生活中的各類視覺分析問題等。
在智慧方面,Step 3擁有強大的視覺感知和複雜推理能力,可準確完成跨領域的複雜知識理解、數學與視覺資訊的交叉分析,以及日常生活中的各類視覺分析問題。Step 3在MMMU、MathVision、SimpleVQA、AIME25、LiveCodeBench(2024.08-2025.05)等榜單上取得了開源多模態推理模型的SOTA成績。

此外,Step 3還有兩大亮點優勢:開源和成本效益高。開源毫無疑問可以幫助契合和開發者降低使用門檻,並加速模型迭代。而成本效益高則是考驗著對模型效能與成本巧妙平衡。
根據原理分析,Step 3在國產晶片上的推理效率最高可達DeepSeek-R1的300%,且對所有晶片友好,在基於NVIDIA Hopper架構的晶片進行分散式推理時,相較DeepSeek-R1的吞吐量提升超70%。

值得注意的是,這一實測結果都是在不犧牲模型啟用引數量、不降低注意力容量的條件下實現的。
隨著大模型技術邁向推理時代,階躍星辰給出了,最適合實際應用的大模型需要滿足強智慧、低成本、可開源和多模態四個特徵。這四個維度缺一不可,因為單點能力強,無法滿足使用者對於模型的綜合需求。唯有模型全面發展,才能讓模型真正用起來。
以Step 3為代表的多模態推理模型正推動單一模態大模型向類人認知能力的方向進化,從而使得AI能在更為複雜的場景落地。
作為“多模態卷王”階躍星辰在當下大模型應用爆發節點交出的最新答卷,它的設計理念使其走向規模化應用成為可能。
究其根源,是階躍星辰在多模態模型賽道的不斷深耕。階躍星辰成立兩年多以來,已經構建起“1+N”的Step系列大模型矩陣,共釋出23款模型。“1”是指Step 3基礎大模型,“N”則為Step系列的多模態大模型矩陣,廣泛覆蓋語音、視覺理解、影像編輯、影像和影片生成、音樂等領域,其模型已經多次在LMSYS、OpenCompass、MATH-Vision等國內外權威基準測試榜上位列中國大模型第一。
02.
聯動頭部晶片天團
組建模芯創新生態聯盟
與此同時,多模態推理模型在實際場景中對應用適配性的嚴苛要求,進一步強化了其與晶片深度適配的必要性。
在此基礎上,階躍星辰將Step 3模型對幾乎所有晶片進行了適配,在設計Step 3模型架構的時候,就已經考慮了國產晶片的硬體特點。
其採用的策略是“內外聯動”,即對內透過系統技術創新來降低模型推理成本、發力開源,對外則深度聯動晶片企業和基礎設施廠商,形成全技術鏈條協同的底層創新模式。
多模態推理模型需要處理影像、音訊、影片、點雲等多種異構資料,這些資料的儲存格式、處理流程、計算強度差異極大,對晶片的算力結構、記憶體頻寬、硬體加速單元等提出了遠超單一模態的挑戰。
而沒有針對性適配的晶片,多模態推理模型要麼因算力不足無法落地,要麼因效率太低難以商業化。
當下降低大模型的推理成本,已經成為決定大模型應用滲透率的關鍵課題,其本質就是提升算力的應用效率。因此,從一定程度上看,晶片適配是多模態推理模型走向商業化落地的核心前提。
今日,階躍星辰聯合華為昇騰、沐曦、壁仞科技、燧原科技、天數智芯、無問芯穹、寒武紀、摩爾線程、矽基流動等近10家晶片、基礎設施廠商發起成立“模芯創新生態聯盟”,打通晶片、模型和平臺全鏈路技術。

目前,華為昇騰晶片已率先實現Step 3的搭載和執行,沐曦、天數智芯和燧原已初步實現執行Step 3。其它聯盟廠商的適配工作正在開展。
模型與晶片企業的聯動最直觀的優勢就是,可以提升模型效能和效率,模型與硬體深度適配可以在降低資源消耗的同時充分發揮模型效能,而這種協同研發的新模式,正是模型、晶片互相驅動升級形成正向迴圈的必然結果。
從更長遠的角度看,這可以降低成本推動規模化商業落地,成為打破推理模型成本居高不下桎梏的一條有效路徑。
03.
多模態能力觸達多元智慧終端
階躍星辰全年營收衝刺10億
在研發思路中致力於讓大模型真正可用的階躍星辰,在商業化應用落地上也突飛猛進。
2025年上半年,階躍星辰的收入快速增長,全年收入衝刺10億元。

這是階躍星辰將大模型能力深度融入手機、汽車以及各類IoT裝置和當下被稱為製造業皇冠明珠的人形機器人的階段性成效,貫穿新興產業與已擁有海量使用者基礎的賽道。
在智慧終端Agent應用側,階躍星辰開放平臺數據顯示,其上半年來自智慧終端的多模態模型呼叫次數和呼叫量,環比增長均超800%。
具體在手機方面,階躍星辰已經和超半數頭部國產手機廠商達成合作,多模態能力落地榮耀、OPPO等品牌的旗艦機型;汽車層面,階躍聯合吉利推出AI智慧座艙,成功實現行業內端到端語音大模型首次量產上車;面向IoT終端,階躍星辰透過生態開放的方式,與包括TCL在內的一系列IoT平臺和裝置廠商緊密協作,推動裝置間的智慧化升級和體驗的無縫連線。
除了直接在不同終端落地的Agent,階躍星辰還亮出了垂類Agent以適配使用者更為細分的應用場景。階躍AI作為階躍星辰基於自研模型能力打造的智慧助手,具備文字、影像、語音等多模態互動能力和推理能力,可以在科研場景幫助使用者核查資訊、視覺理解生成、視訊通話等。
Agent被認為是大模型的下一個焦點,其既是大模型目前應用落地的絕佳載體之一,同時是企業探索AGI的主要路徑。從階躍星辰的佈局可以看出,其已經將多模態大模型的能力內化到千行百業,在各類智慧終端裝置上落地。
在這樣的全棧佈局下,階躍星辰在基礎模型、智慧終端Agent、垂類Agent領域三管齊下,成為大模型應用落地率先衝出的一家創企。其半年時間落地應用成果已遍地開發,不僅催生出眾多實際落地的智慧終端裝置,更構建起健康協同的商業模式,形成了良性發展生態。
04.
結語:大模型商業化落地競速開啟
隨著大模型發展邁入下半場,行業競爭的焦點已從基座模型的效能比拼,深度延伸至商業化落地的速度與質量,階躍星辰已然趟出一條商業化與模型研發共進的路徑。
階躍超級模型+超級應用戰略的雙輪驅動,使其在大模型下半場的競爭中佔據了獨特優勢,模型研發為商業化提供能用、好用的技術底座,商業化落地為模型迭代注入源源不斷的場景資料與需求靈感,二者協同勾勒出大模型從技術創新到產業價值轉化的清晰路徑。

(本文系網易新聞•網易號特色內容激勵計劃簽約賬號【智東西】原創內容,未經賬號授權,禁止隨意轉載。)
