“狠人”閆俊傑,闖關IPO

“MiniMax在探索一條之前沒有被驗證過的路。”

|《中國企業家》記者 孔月昕
編輯馬吉英
頭圖來源|受訪者
6月17日,在MiniMax官方公眾號釋出了全球首個開源大規模混合架構推理模型MiniMax-M1後,公司創始人閆俊傑隨即轉發到朋友圈,並配文稱:“第一次感覺到大山不是不能翻越。”
之所以這麼說,是因為M1模型透過以閃電注意力機制為主的混合架構和更快的強化學習演算法CISPO(一種強化學習演算法,透過裁剪重要性取樣權重提升強化學習效率)兩項技術突破,實現了深度推理的顯著高效,並提升了強化學習的效率。據公司介紹,整個強化學習階段只用了512塊H800三週的時間,換算成(算力)租賃成本為53.47萬美元。
除了M1外,在之後的4個工作日里,MiniMax又連續釋出了Hailuo 02影片生成模型、MiniMax Agent通用智慧體、Hailuo Video Agent影片創作智慧體、Voice Design音色設計。在MiniMax Agent釋出當天,閆俊傑的朋友圈配文是:“研發中越來越強烈的感受是AI的價值可以開始被經濟來衡量。”
與此同時,MiniMax在資本市場也有新訊息傳出。6月,公司被爆出正考慮在港股IPO的訊息。
來源:受訪者
這一訊息並非空穴來風:早在2024年,MiniMax旗下產品星野AI(Talkie)的營收已突破千萬美元,在海外市場表現尤其出色,下載量曾超越CharacterAI,成為美國AI應用Top4。財務實力的支撐更為關鍵——知情人士透露,公司今年以來透過多輪未公開融資,積累了充足的現金儲備(約十幾億美元)。近期還完成了Pre-IPO融資,使其成為大模型創業公司中資金最雄厚的玩家。
截至發稿,對於資本市場相關進展,公司方面並未正面回應
充足的現金儲備讓閆俊傑具備了高度的戰略自主權,也讓這位“賭性”很重的創業者,能堅定推行“加速技術迭代”的發展路徑。明勢創投合夥人夏令此前參加活動時,曾評價MiniMax是“一家兼具野心、資源實力與非共識堅持的公司”,明勢創投創始合夥人黃明明則稱,“閆俊傑是一個‘狠人’,在資源等方方面面有限的情況下,他還是專注在模型研發上。只有這樣的企業家可能才能走得更遠,走到終局。”

錨定MoE架構破局
2021年12月,商湯上市前夕,作為副總裁、研究院副院長和智慧城市事業群CTO的閆俊傑,選擇離開商湯。
在閆俊傑看來,2020年之前,AlphaGo做過很多東西,整個社會對人工智慧的關注度和期待值都非常高,且國內外都投入了大量的研發資金,但當時的人工智慧只能做一些非常簡單的事,比如人臉識別、語音識別等,創造的社會價值比較低。
對於當時的閆俊傑來說,這是一件“很痛苦的事”,他逐漸意識到,核心因素在於當時的人工智慧不夠通用。
來源:AI生成
“當時我們用虛擬模型解決客戶的問題,一旦客戶有無數個問題,就得做無數個模型,即每做一個模型就要訓練一次,還要導資料,整個生產鏈條非常慢。因此我們只能服務一些大客戶,因為企業需要定製,但定製的成本週期很長,商業模式也變成了定製模型。”閆俊傑回憶。
他在思考的是,“如果不做定製模型,把模型做得通用,是不是就可以服務普通人了?”
同時,閆俊傑恰好看到了OpenAI關於GPT-3的論文,並受到啟發,“把(GPT)模型放大10倍,技術路線就可能成立了。”
不過,做通用的工具和閆俊傑在商湯的研發路線完全不一樣,需要的人才、組織結構也不一樣,閆俊傑由此發現,“這應該是一家新興公司的機會。”2022年初,MiniMax正式成立。
雲啟資本是MiniMax早期投資方之一,合夥人陳昱最初跟閆俊傑接觸時,就發現閆俊傑是一位野心比較大的創業者,“他想做中國的OpenAI或DeepMind,最終實現通用人工智慧”。
在技術路線的選擇上,閆俊傑也非常大膽。
2023年下半年,大部分中國同行還在繼續迭代稠密模型(dense model),它能更穩健地提升大模型效能。閆俊傑則幾乎把全部研發和算力資源都投到了一件更不確定的事情上——MoE(混合專家系統)模型。
黃明明回憶,彼時,MoE在矽谷都不是主流共識,只有OpenAI在做,甚至MoE的提出者,都沒有把MoE這條路堅持走下去。
在閆俊傑看來,儘管OpenAI尚未公開GPT-5,但其內部已完成了該模型的訓練。GPT-5的訓練需要高達5萬張卡的算力,短期內,國內難以達到3萬張卡的規模,因此若要實現與GPT-5相當的效果,必須採用更高效的演算法(MoE),否則就永遠追不上(OpenAI)。因此,MoE也成了團隊“一定要做的事情”。
2023年夏天,閆俊傑帶領MiniMax團隊開始專注研發MoE。
黃明明認為,閆俊傑看上去是一個很溫和的人,實際上他很瘋狂。在認定終極目標後,他會把所有資源all in,去賭這個事情。
“他把當時手頭80%的算力資源都用來推MoE。”黃明明說,“前兩次是失敗的,直到第三次成了,他才跑過來跟我們(投資人)講,MoE差不多能搞定了。”
黃明明問閆俊傑:“為什麼你要賭這麼大?你賭不出來,可能這家公司就掛了。”
閆俊傑的回覆是,“只有我把MoE做出來,才能用更低的成本向更高的模型階段去演進,否則用的是一個不可估量的成本去往下一步,沒有一家公司能支援這樣token的消耗量去往更高的平臺進化。”
點選封面訂閱全年雜誌

應對DeepSeek,慢了一步
2025年1月15日,MiniMax釋出了首個開源模型MiniMax-01系列。
在接受晚點採訪時,閆俊傑指出,開源的核心價值在於加速技術進化。“更好的模型可以導向更好的應用,但更好的應用和更多使用者並不會導向更好的模型。”閆俊傑說。想清楚“智慧水平的提升,沒那麼依賴使用者規模”後,閆俊傑做出了取捨,他認為現在MiniMax最重要的目標不是增長,也不是收入,是“加速技術迭代”,並堅定了要做一家技術驅動型公司的念頭,開始有意識地打造技術品牌。
但從行業變化看,閆俊傑還是“慢”了一步。2024年12月26日,DeepSeek-V3釋出後,在業內形成一定的口碑和品牌效應。2025年1月20日,DeepSeek-R1釋出,在大眾層面掀起的聲量迅速蓋過了相對低調的MiniMax,進一步搶奪了C端使用者的心智。
面對洶湧而來的DeepSeek衝擊波,國內模型廠商主要分成了兩隊,一隊是積極擁抱,大力宣傳旗下產品接入DeepSeek;另一隊是堅決不接入DeepSeek,並死磕自研自己的推理模型。
MiniMax的選擇是,在國內C端應用上堅持不接入DeepSeek,只在海外的AI應用上選擇接入DeepSeek。
同時,據MiniMax內部員工透露,DeepSeek釋出並沒有影響他們研發團隊的節奏,內部還是保持原有計劃,專注且低調地進行技術研發。
來源:視覺中國
黃明明也表示,他們非常認可MiniMax持續專注在底層模型的研發上。“好的應用或好的產品,都是模型能力自然而然的體現,模型能力強了,一定會做出好的產品。事實證明,當模型能力不夠強時,做出的產品就需要很多縫縫補補,打很多補丁,耗費巨大的人力和物力,並喪失你在底層模型上的專注度。”黃明明說。
6月中旬,MiniMax連續釋出了包括基礎模型及應用在內的5款產品,業內對於其模型和應用的產品評價比較正面,Hugging Face工程師王鐵震告訴《中國企業家》:“MiniMax在探索一條之前沒有被驗證過的路,非常有價值。”
(注:Hugging Face是一家成立於2016年的美國人工智慧公司,致力於構建開源的機器學習社群和平臺,提供豐富的預訓練模型、資料集和工具,幫助開發者更便捷地構建、訓練和部署AI應用。)
不過,MiniMaxM1系列模型並未引發大範圍轟動。截至7月10日,其在Hugging Face最熱帖下載量僅25.2K,GitHub最熱帖收藏量僅3K——這一資料明顯低於Google、Meta今年初發布的開源模型,也遜色於DeepSeek-R1的收藏及下載量。
部分Agent創業者反饋,雖注意到MiniMax M1模型的釋出,但因自身產品上線排期緊張,暫未及時投入測試。另一位AI領域創業者告訴《中國企業家》,當前海外AI領域熱點頻發(如GPT-5釋出在即,Meta新模型迭代),分散了行業注意力,客觀上削弱了M1的傳播聲量。在他看來,國際模型技術仍具備一定領先優勢。
對此,一位MiniMax投資人表示,MiniMax一貫的風格是相對低調和剋制,它最後交付的產品口碑,可能比大家記住模型名字或下載量更重要。
“你只有最後交付一個產品,才容易做商業化,才有可能達到上市的體量。快手的可靈交付的也是一個生產工具,大家看重的也是產品,而非快手的影片模型。”該投資人補充道。
新聞熱線&投稿郵箱:[email protected]

END
值班編輯:王怡潔審校:姜辰雨  製作:袁茂麗
關注“中國企業家”影片號
看更多大佬觀點和幕後故事
清華教授張亞勤邀您一起讀
《中國企業家》
掃描下方二維碼,訂閱2025全年雜誌
[ 推薦閱讀 ]


相關文章