
作者丨陳彩嫻
今天訊息,階躍星辰完成了 B 輪融資,總融資金額達數億美元。AI 科技評論獲悉,此次融資有國資、戰略和財務投資人等多家參與,核心投資方包括上海國有資本投資有限公司及其旗下基金,戰略和財務投資人包括騰訊投資、五源資本、啟明創投等。據瞭解,這筆融資將用於繼續投入基礎模型研發,強化多模態和複雜推理能力,並透過產品和生態加大覆蓋 C 端應用場景,提供豐富的使用者體驗。
這起融資事件在業內引起了廣泛關注。此時距離智譜官宣其完成最新一輪 30 億人民幣的融資才不到一週。上一週,智譜的融資被視為「可能是 2024 年大模型領域最後一筆融資」,但這個預言隨著階躍星辰的融資訊息被打破。
不僅如此,階躍星辰的追趕,也使得未來至少一年內中國大模型的競爭格局將發生肉眼可見的變化:
首先是 200 億估值的門檻跨越。
在今年 6 月底 AI 科技評論發表的《200 億估值之後,中國大模型公司還能拿誰的錢?》一文中,我們就已提到 200 億估值對大模型公司來說將是一道檻,跨得過就至少能撐到下一輪牌桌,跨不過則意味著更漫長的消耗與挑戰。
據我們瞭解,智譜是國內第一家跨越 200 億估值門檻的大模型,此外還有 MiniMax、月之暗面、百川智慧。本輪階躍星辰沒有披露其估值,但據 AI 科技評論獲悉,階躍星辰很可能是 2024 年最後一家跨過 200 億門檻的大模型公司。
其次是迴歸基座大模型話題,智譜與階躍成為「基座雙雄」的勢力格局愈加明晰。
隨著過去兩年的技術與產品探索,截至 2024 年 12 月,200 億以上估值的大模型公司在發展路線上越發涇渭分明。這其中,MiniMax 主打出海,月之暗面主打 C 端產品,百川智慧轉向醫療等垂直領域——「主打」並非「單一」,但在基座大模型賽道,只有智譜與階躍堅持追求基座大模型的預訓練與效果提升,同時積極探索商業模式。
作為一家成立不到兩年的公司,階躍星辰能快速追趕,是令筆者意想不到的。一年前,階躍星辰還未浮出水面;一年後,這家大模型獨角獸已經崛起,成為一股無法忽視的國產大模型力量。
在得知階躍星辰或是 2024 年最後一家拿到融資的大模型公司後,驚訝之餘,筆者也與國內多位投資人圍繞目前國內幾家明星大模型公司的融資與估值進行了討論。
今年年中,業內 VC 投資創業公司的普遍觀點是「追求賠率」,如押某一家公司的 C 端應用,賭其是否能成為爆款。在這種趨勢下,上半年 Kimi 概念股的爆發是意料之中,這一階段的踴躍分子也以 PE 為主。但到了下半年,隨著大廠入局用流量澆灌C端應用,「追求勝率」就成為更受歡迎的觀點,按這套邏輯,繼續研發通用基座大模型的公司會有更廣闊的市場空間,且資方中擁有國資背景的大模型創業公司也被視為這一邏輯下的最佳選擇。
今年下半年,在大模型投資愈加冷靜的大環境下,智譜與階躍還能拿到融資,除了兩個團隊的技術實力使然,或許也是因為其符合當前追求勝率的投資目標。
一位人民幣基金的從業者直截了當地評價:「至少智譜與階躍目前還有投資邏輯,其他家的不確定性高:Kimi 只有 C 端增長,要看投流有沒有收益、以及能不能打得過豆包;MiniMax 的角色扮演產品與出海要賭賠率,看能不能爆發。如果賭上市,階躍與智譜還有勝率。」
「如果走網際網路產品的流量邏輯,那麼大模型的 C 端產品只有三條路:要麼勝出,要麼死掉,要麼轉型。」一位投資者向 AI 科技評論說道。
都知道,AI 2.0 之所以比 AI 1.0 的想象力更大,是因為 AI 1.0 時代公司的技術能落地的 C 端場景依然不夠廣泛,競爭到最後往往是跟垂直領域的傳統行業競爭,如安防領域的海大宇、手機領域的虹軟,而 AI 2.0 時代大模型技術落地能進入廣泛的網際網路產品賽道,因此更「Sexy」。但也正是因為跟網際網路的邏輯太近,加上 C 端產品有「新鮮感焦慮」,所以目前國內大模型公司在 C 端的收入仍面臨重重挑戰。
不過,純 B 端的模式也不受追捧。據 AI 科技評論瞭解,今年 B 端大模型收入也受到了來自華為、科大訊飛等大廠的競爭,導致一些企業的 B 端收入沒有去年高。加上純 B 端故事不好撐估值,所以一些類 B 端的營收也被放到了 C 端下。
總的來說,對AI2.0時代的創業公司而言,誰能最先推出通用能力最強的基座大模型,成功進入最多的商業化場景中激發C端消費需求,才會成為資本的寵兒。
基座大模型的能力提升仍是當前的重中之重。即使已經過去兩年,技術增長仍是大模型公司吸引融資的一大要素。
當前第一梯隊的大模型公司中,只有階躍與智譜仍追求基座大模型的效果提升,也只有這兩家最像 OpenAI。
堅持基座大模型研發,意味著堅持 AGI,才能支撐起更高上限的資本故事和商業化空間。從成果釋出來看,智譜依舊在對標 OpenAI 推出新模型,而從年底國際權威榜單 LiveBench 與 LMSYS 來看,階躍星辰的模型水平也是國內為數不多能與 OpenAI、Anthropic 等國際頂尖大模型公司一較高下的。
其餘三家,百川對外講醫療大模型的故事。相比智譜有唐傑帶隊與清華子弟兵,階躍星辰有前微軟全球副總裁姜大昕帶隊加朱亦博與張祥雨等核心骨幹。而 MiniMax 與月之暗面都是主打 C 端產品,一個出海、一個對內,相比預訓練,產品創新與體驗的效果提升優先順序更高。
如果再加上上市的考慮,智譜與階躍也是投資者最青睞的兩個標的。背後的原因很簡單:「北京跟上海都押一個寶。」一位投資者告訴 AI 科技評論。
根據公開資訊與行業分析,智譜的背後主要是北京國資,階躍背後則是上海國資。在 12 月宣佈的最新一輪融資中,智譜的投資方全是國資,由北京海淀區政府的市場化投資平臺中關村科學城⽀持。階躍星辰B輪核心投資方包括上海國有資本投資有限公司及其旗下基金。
縱觀「大模型六小虎」背後的資方情況,不難發現各有特色:MiniMax 和月之暗面以網際網路投資居多,智譜是純國資加網際網路,百川同時吸納了北京與上海的國資加網際網路、但沒有洋氣的美元基金,階躍是上海國資、戰略和財務投資人,零一萬物則是純美元與外資為主。
作為一家成立不到兩年、但死磕基座大模型的創業公司來說,階躍星辰的進步速度比我們想象地要快很多。角逐基座大模型其實是一件投入成本高、同時技術挑戰大的事情,尤其在國內面臨的競爭對手是成立時間最長的大模型獨角獸智譜。
在這樣一個看似不可能的目標下,階躍星辰依然能得到投資方的認可,說明實力不可小覷。2025 年,階躍很可能是智譜最有力的競爭對手。
如果將更多的聚光燈給到階躍星辰,我們驚詫地發現:這家成立不到兩年的大模型公司,在過去的10個月裡竟釋出了 11 款基座模型;也就是說,他們平均不到一個月就有一次釋出,意味著其基座模型迭代的速度飛快,為中國大模型之最。
根據基座模型的能力劃分,階躍星辰的 Step 系列大模型矩陣覆蓋了從千億引數到萬億引數、從語言到多模態、從理解到生成的全方位能力。
在語言大模型上,階躍星辰先後分佈了千億引數語言大模型 Step-1、萬億引數語言大模型 Step-2 與 Step-1-flash 極速版大模型。
其中,Step-1 只用兩個月就一次性訓練成功,在邏輯推理、中文知識、英文知識、數學與程式碼等方面的能力全面超越了 GPT-3.5。Step-1-flash 極速版大模型能夠處理上下文長度為 8K 的長文字。Step-2 採用 MoE 架構,是國內首個由大模型創業公司釋出的萬億引數語言大模型。
在剛剛過去的 11 月,Step-2 更是在「最難 LLM 評測榜單」LiveBench 上成為唯一進入榜單前十名的中國語言大模型,位列全球第五,超越了 GPT-4o 和 Gemini-1.5,拿下中國第一。
當時同樣上榜的大模型還有通義千問和 DeepSeek,但均沒有衝進前十,分別位列第十三和第二十三名。上述提到的估值超過 200 億人民幣的第一梯隊大模型公司,則除了階躍星辰外均沒有上榜。

榜單鏈接:https://livebench.ai/,2024-11-19
語言基座大模型是競爭 AGI 的准入門檻。根據 LiveBench 的結果,階躍星辰的 Step-2 能成為上榜模型,實力不言而喻。換言之,即使基座大模型的競爭到最後只會剩下少數幾家,階躍星辰的基座模型憑藉技術實力也能贏得最終的入場券。
從技術發展的趨勢來看,OpenAI 認為,AGI 的實現會分為五個階段:第一個階段是聊天機器人,AI 具備語言對話能力;第二個階段是推理模型,AI 可以解決人類層面的問題;第三個階段是智慧體(Agents),AI 系統可以自主決策與執行;第四個階段是創新模型,AI 可以自主思考並誕生想法;第五個階段是智慧組織,AI 可以完成組織性的工作。
第五個階段被認為與當前具身智慧對通用機器人的追求重合,即無論是一個人工智慧系統或一個機器人,均可以完成一個工種的全流程、而非其中一個或兩個步驟。OpenAI 認為,他們現在才處於階段二,即模型的推理層,代表成果是 o1。
而在國內的學術探討中,AGI 的實現從階段一到階段二的研究目標除了包括思維鏈在內的模型推理,還有多模態。目前多模態模型的研發還沒有一個主導性的思路,多模態不僅包含語言,還包含視覺、以及語言與視覺乃至語音等多個模態的資訊對齊,視覺研究人才將在這當中發揮重要作用。
眾所周知,階躍星辰由前微軟全球副總裁姜大昕博士創立。據悉,階躍在技術上下一階段的目標是實現多模態理解和生成一體化。階躍星辰的研發團隊有諸多牛人,包括計算機視覺領域核心奠基工作 ResNet 的二作張祥雨;
此外,大模型的訓練需要消耗大量算力,技術底層系統能力將決定創業公司能否以最高的價效比和效率訓練模型。階躍星辰的系統負責人為朱亦博,其先後任職於微軟、位元組與谷歌,在大規模系統和萬卡叢集方面有豐富的實踐經驗。
不同於 AI 1.0,AI 2.0 時代的基座大模型在預訓練中不僅要求演算法能力強、也要求底層系統的高效與穩定性。國內同時兼顧演算法與系統方面強勢人才的大模型公司並不多,階躍星辰是之一,這也是為什麼過去一年階躍星辰不僅在語言基座大模型、同時在多模態大模型上也頻繁釋出研究成果的原因。
過去一年,階躍星辰在多模態領域已經發布了 8 個大模型,包括:
兩款多模態大模型 Step-1V 與 Step-1.5V,其中 Step-1.5V 是在 Step-1V 的基礎上迭代,從影像理解升級到了影片理解。今年 11 月,LMSYS Org 釋出 Chatbot Arena 最新榜單,Step-1V 上榜位列視覺領域中國大模型第一,總分跟 Gemini-1.5-Flash-8B-Exp-0827 持平,超過國內所有大模型公司。
一款影像生成大模型 Step-1X,其具備強大語義理解與影像創意實現能力,可用於各種影像創作與設計任務。
兩款影片模型:Step-1.5v-turbo 影片理解模型與 Step-Video 影片生成模型,不僅能準確識別並理解影片中所出現的物體、人物和環境,具備突出的指令跟隨能力,還能文生影片,生成 1080P 長達 10s 的高畫質影片,尤其擅長生成具有中國風美學效果的影片。
除了文圖與影片,階躍星辰還發布了三款語音大模型:Step-tts-mini 語音復刻和生成大模型、Step-asr 語音識別大模型與 Step-1o Audio 語音大模型。其中,Step-tts-mini 只需上傳 5s 音訊就能進行生動形象的音色復刻,Step-1o Audio 是國內首個千億引數端到端語音大模型、支援語音與文字的混合輸入與輸出。
國內大模型創業公司極少同時兼顧語言、影像、影片與語音等多個模態的基座模型,目前看來,階躍星辰的基座模型研發還在持續加速,體現了其堅持追求 AGI 的理想與決心。
值得注意的是,不斷打磨基座模型的同時,階躍星辰在將技術應用落地上也有獨特思考。
毫無疑問,大模型會衍生出全新的商業模式,目前各家都還在探索中。據觀察,當前階躍星辰的嘗試是透過自研與幫助生態夥伴的方式去打造 C 端超級應用。
目前階躍星辰最廣為人知的自研 C 端產品是智慧助手「躍問」。
同時,他們也與客戶進行了更深入的合作,比如在金融領域與財聯社成立合資公司「財躍星辰」一起打造了 C 端應用「AI 小財神」。後者的合作形式不是隻提供 API、解決方案或私有化部署,所以跟 AI 1.0 時代的純 B 端打法也有所不同。
目前躍問已經接入Step-2 萬億引數大模型和 Step-1.5V 多模態模型,具有智慧搜尋、拍照答疑、高效閱讀、寫作、翻譯等能力,而且率先將多模態功能「拍照問」接入了 iPhone 16 的「相機控制」,實現了真正意義上的「智慧視覺搜尋」。
OpenAI 預言 AGI 的下一個階段是智慧體,某個意義上,階躍星辰基於 Step 自研基座模型所打造的「躍問」、或「AI 小財神」應用,也是在探索 AGI 時代的智慧體。比如,「AI小財神」能夠為使用者提供包括 AI 資料探勘、AI 對話、AI 熱點資訊和財報解讀等功能。
在開發者生態中,階躍星辰開放平臺也推出了「繁星計劃」,幫助開發者打造 AI 應用。據瞭解,網紅 AI 應用「胃之書」、國內首款 C 端 AI 電商應用「物圓」、AI 科研大模型專業社群「ReadPaper」、AI 心理陪伴應用「林間聊愈室」、面向胰腺癌腫瘤患者的智慧 RAG 平臺「小胰寶」等等應用都是基於階躍星辰的 Step 大模型。
中國第一梯隊的大模型公司中,原先智譜、MiniMax、月之暗面與百川智慧獨佔鰲頭,花開四朵、各表一枝。一年過去,大浪淘沙,百川退出預訓練模型的競爭隊伍,月之暗面與 MiniMax 的優先順序在產品,只有智譜與階躍有實力、有決心對標 OpenAI,堅持研究基座大模型。
在不遠的未來,模型效果仍是決定上層應用的關鍵因素。基座大模型雙雄,北有智譜、南有階躍,孰勝孰敗一時還難以分曉,不如將答案交給時間。

更多內容,點選下方關注:

未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社群進行轉載!
公眾號轉載請先在「AI科技評論」後臺留言取得授權,轉載時需標註來源並插入本公眾號名片。
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社群進行轉載!
公眾號轉載請先在「AI科技評論」後臺留言取得授權,轉載時需標註來源並插入本公眾號名片。