國產大模型「五強爭霸」，決戰AGI！

新智元報道

編輯：編輯部 HYZ

【新智元導讀】中國基礎大模型市場，徹底變天了！如今牌桌上的玩家已經變成了「基模五強」——位元組、阿里、階躍星辰、智譜和DeepSeek。接下來的巔峰之戰，關鍵制勝點又會在哪裡？

DeepSeek的橫空出世，已經徹底改變了全球的AI局勢。

從此，不僅中美大模型競爭格局改變，國產大模型的產業版圖，也被一舉打破！

縱觀中國基礎大模型的市場，可以看到，如今的基礎大模型版圖已然改天換地，演變為全新的五強格局——

位元組、阿里、階躍星辰、智譜，以及DeepSeek。

新基模五強突圍，下一個制勝點在哪？

脫穎而出的這五強，為何能成為留在最後的玩家？

答案很簡單——要麼有錢，要麼有人。

前者，道理不言自明。訓練大模型是明牌重注，要麼得自家有糧，要麼就得有大腿。

像位元組、阿里、DeepSeek，都屬於有糧的型別；而智譜和階躍星辰，則無疑屬於後者。

其中，上海隊的階躍星辰，最新一輪融資發生在24年底至25年初，B輪已融資數億美金；北京隊的智譜，在2025年3月已經拿下18億人民幣的融資。

而說到人，當然就是高密度人才，尤其要有行業認可的技術領軍人物。

我們仔細盤盤就能發現，五強在這方面是分足鼎立，各有骨幹。

位元組的吳永輝，阿里的吳泳銘、周靖人，階躍星辰的姜大昕、張祥雨、朱亦博，智譜的唐傑、張鵬，DeepSeek的梁文鋒，都是在業界足以撼動局勢的人物。

滿足了有錢又有人，在這方面起跑線上各家都差不多，接下來要比拼的，就是硬貨了。

基模五強，各領風騷

其實仔細分析，就能發現這五強的共性。

要麼是全才，模型的能力要能做到全面覆蓋，且效能在第一梯隊。要麼就是專才，模型在某一方面遙遙領先。

阿里：開源王者，全球第三

阿里以「開源王者」的獨特定位，不僅在國內市場佔據重要席位，更在全球AI開源生態中，穩居全球TOP 3模型貢獻者。

斯坦福2025年人工智慧指數報告

可以說，阿里是國內過最開源自研LLM網際網路巨頭，也是全球唯一一家實現「全尺寸、全模態」開源的雲計算廠商。

可以說，作為開源最早、最完整的大公司，阿里在AI的投入上最堅決，也是如今佈局最全、最先賺到錢的中國網際網路大廠。

自2023年以來，通義團隊累積開源200+模型，涵蓋了千問（Qwen）大語言模型和萬相（Wan）視覺生成模型兩大基座系列。

這些模型覆蓋了文字生成、視覺/語音理解生成、文生圖，以及影片生成等全模態，引數規模從0.5B到235B不等，跨越119種語言及方言。

兩年前，國內LLM市場尚處於「百模」混戰階段，阿里率先將Qwen-7B開源，吸引了全球開發者的關注。

截至目前，Qwen全球下載量超3億，衍生模型數量超10萬，超越Llama成為全球第一開源模型。

在Hugging Face社群，2024年Qwen系列佔全球模型下載量的30%以上，穩居第一。

25年2月，Hugging Face全球開源大模型榜單中，排名前十開源模型全部基於Qwen二次開發

在這場「燒錢」的遊戲中，未來三年，阿里還將投入3800億元用於AI研發，用於雲和AI硬體基礎設施，總額超過去十年總和。

這一投入規模在國內網際網路公司中首屈一指，恰恰展現了阿里在AI賽道上的戰略決心。

相較於其他大模型玩家，阿里憑藉成熟的商業化路徑和廣泛的客戶基礎，率先實現了投入到回報的閉環。

截止2025年1月底，透過阿里雲百鍊平臺呼叫通義大模型API的企業已超過29萬。

位元組：巨型航母，重回創業

位元組的大模型以「綜合能力強」為特色，覆蓋了文字生成、影像理解、影片生成、語音處理等多模態領域。

在這場技術與資源的巔峰對決之中，位元組不僅在自研大模型和AI應用領域，展現出了「兇殘的戰鬥力」。

目前，位元組旗下的AI應用超20多款，爆火核心產品「豆包」憑藉其強大文字生成和多模態能力，迅速佔領使用者心智，月活使用者超1億。

影片生成工具「即夢」也被賦予了更高的戰略優先順序，已在虛擬偶像、電商直播等領域，實現商業化落地。

同樣，位元組在AI程式設計領域不敢落後。他們推出的AI程式設計工具Trae，直接對標Cursor等AI整合開發環境。

在企業服務方面，基於豆包大模型，火山引擎「飛連」也在多場景落地AI應用等。

位元組的全面佈局，還體現在其生態整合能力上。透過抖音、今日頭條、飛書等平臺，位元組將大模型嵌入到內容推薦、協同辦公中，形成了技術到應用的生態閉環。

而如今，位元組以「巨型航母重回創業」姿態，憑藉雄厚資金、超高人才密度、多方向全面佈局，成為中國AI賽道領跑者之一。

階躍星辰：低調的大模型國家隊

跟其他家相比，階躍星辰可以算是這五強中最低調的大模型國家隊了。

可以說，階躍星辰是生於上海、長於上海的國家隊。2024年底，階躍星辰完成了總額達數億美元的融資，核心投資方包括上海國有資本投資有限公司及其旗下基金，戰略和財務投資人包括騰訊投資、五源資本、啟明創投等。

如今，才成立2年的階躍星辰，已累計釋出22款自研基座模型，覆蓋文字、語音、影像、影片、音樂、推理，其中有16款是多模態模型，效能領跑全行業，成為行業內公認的「多模態卷王」。

其中，Step-1o Vision便在2025年初分別在知名大模型競技場Chatbot Arena和國內權威評估平臺「司南」（OpenCompass）中，分別拿下了視覺領域中國大模型第一，以及多模態模型榜單第一的成績。

更難得的是，階躍星辰的多模態矩陣既全面，又在全行業領先。要知道，多模態模型的核心，就是綜合能力，既要求語音、圖片、影片多個模態的能力，又要求模型能理解、生成、推理。在此佈局上，階躍星辰的每條線都達到了第一梯隊。

而多模還有一大難點，就是融合過程中不能損失單個模特的效能，尤其不能降智。而階躍星辰採取了原生多模的方式，在此方面經驗獨到。

在階躍星辰看來，多模態是通往AGI的必經之路。隨著多模態互動和推理的融合愈加成熟，更多Agent會在智慧終端上湧現。

現在，階躍星辰正在發力徹底解決視覺領域根本難題——表徵和對齊的基礎問題，也即「predict next frame」。

未來，按照階躍星辰的多模研發路徑，AI將能建模物理世界互動，模擬整個世界，構建世界模型。至此，AGI就將實現。

在成立之初，姜大昕團隊曾繪製過這樣一幅智慧演進路線圖，將智慧進化分為模擬世界、探索世界、歸納世界三個階段

與此同時，階躍星辰的核心技術人員已經在一線親歷十年AI發展，這支隊伍的人才密度極高，既有技術洞察，又有實戰經驗，堪稱是基模的「夢之隊」。

其中，創始人、CEO姜大昕曾擔任微軟全球副總裁，微軟亞洲網際網路工程院副院長、首席科學家。入選2025年IEEE Fellow的姜大昕博士，是唯一來自中國大模型創業公司的入選者。

而首席科學家張祥雨，其參與著作的《用於影像識別的深度殘差學習》論文（ResNet）是21世紀以來全球被引用次數最多的論文，引用量已超過25萬次。

商業化方面，目前已有多家頭部企業和大量AI應用開發者對階躍的多模態模型表示認可，紛紛接入。同時，階躍還將智慧終端Agent視為大模型落地的核心突破點，已和吉利汽車、千里科技、OPPO、智元機器人、原力靈機、TCL等達成了深度合作。

智譜：全棧創新，發力智慧體

作為國內首個開啟IPO大模型創業公司，智譜背靠清華技術底蘊以「學院派」獨特氣質脫穎而出，在基座模型、多模態技術和智慧體展開全面佈局。

目前，智譜已經建立了新一代認知大模型技術體系，研發了全棧自主GLM系模型，效能指標與國際頂尖LLM對齊。

去年8月，GLM-4-Plus問世在多個任務上表現優異，與GPT-4系不相上下。

今年4月，智譜再次開源32B/9B系列GLM模型，包括基座、推理和沉思模型。以320億引數比肩千億引數主流模型效能。

其中的GLM-Z1-Rumination沉思模型，便是智譜對AGI下一代技術的最新探索。

在智慧體方面，智譜先於OpenAI提出Phone Use概念並推出Agent產品，併發布了全球首個集深度研究與實際操作於一體L3級智慧體——AutoGLM沉思。

如今，他們正憑藉AutoGLM及GLM-PC與全球車企、PC及手機廠商展開深度合作，推動大模型從Chat走向Act。

智譜的商業化路徑以2G和2B業務為核心，深度繫結政府和企業需求。

其構建了MaaS私有化部署和智慧體平臺等服務模型，形成了包含百萬規模開發者的模型服務新生態。

據統計，MaaS平臺支撐80餘萬企業、應用開發者。

這種學院派創業模式，使得智譜在技術深度和戰略穩定上，佔據領先優勢。

DeepSeek：研究導向，厚積薄發

DeepSeek，則是五強中目前最受國外矚目的一位。在中美AI競賽中，也是被提及最多、存在感最強的一家。

可以說，這是一位特立獨行的技術奇兵，直接以一己之力，掀翻了大模型的牌桌。

DeepSeek技術的特點，就是聚焦語言模型，特別是數理能力，走堅定的開源路線。

上下滑動檢視

今年過年時，DeepSeek-R1給全世界帶來了億點點震撼，以極低的計算資源，取得了媲美GPT-4等頂級AI模型的效能。

相比OpenAI、Anthropic訓模型時動輒投入的數億美元資金、數萬張高階GPU，DeepSeek四兩撥千斤的核心秘訣，就在於下面這種極致的工程最佳化。

比如，MoE架構讓模型總引數量達到671B，而在執行時卻只需啟用37B，大幅降低了計算需求；多token預測（MTP），則提高了AI的訓練效率，避免逐字預測；多頭潛注意力（MLA），讓模型更精準地分配了計算資源。

總之，DeepSeek成功的關鍵，就在於偏研究型的導向，而非以盈利為短期目標。從研究角度鼓勵工程師提效，不必面臨財務變現壓力。

而DeepSeek團隊，也匯聚了多位頂尖人才。創始人梁文鋒，在用人上也有著自己獨特的原則。

比如，以應屆和畢業一兩年的人才為主，不追求規模，而是構建小而精的團隊。

隨著大規模的破圈，雲廠商、行業夥伴紛紛積極接入，讓模型的生命力持續旺盛。

在DeepSeek的熱潮下，如今已經有億萬普通使用者開始擁抱AI。

決戰下一階段

「智慧上限」與「多模態能力」

當「基模五強」的格局初步形成，競爭的焦點也隨之轉向更為核心和前沿的技術領域。

技術決勝點，聚焦何處？

顯然，追求更高的「智慧上限」和突破的「多模態能力」，已成為通往AGI路上必須搶攻的兩大技術高地。

一方面，追求智慧的上限，仍是當下大模型領域最重要的事情。

當前領先的模型雖然在許多工中表現驚豔，但在邏輯推理、常識理解、長文字處理等方面，仍有較大的提升空間。

提升智慧上限的最終目標，是邁向能夠執行任何人類智力任務的AGI，這需要模型具備更深層次的理解、學習、推理和創造能力。

另一方面，多模態理解與生成的統一是走向AGI的必經之路。

人類透過多種感官與世界互動，並獲取資訊。要讓AI真正理解並融入複雜的世界，就必須賦予其處理和融合文字、影像、音訊、影片等多種模態資訊的能力。

當理解與生成統一，不僅能推動智慧體在智慧終端的普及，還能透過具身智慧與物理世界互動，自己收集環境資料，構建世界模型。

在世界模型的基礎上，再加上覆雜任務的規劃、抽象概念歸納的能力，強化學習演算法能力，以及超級對齊能力，就有可能實現AGI。

總而言之，未來對更高智慧上限的無盡探索和多模態能力的深度融合，將是決定這場競賽勝負的關鍵。

如今站在AGI的門檻前，「基模五強」的競爭不僅是技術的較量，更是資源、人才、生態的全面博弈。

位元組、阿里、階躍星辰、智譜、DeepSeek這五大領軍者，正以其各自獨特的優勢和戰略遠見，引領中國AI不斷逼近世界前沿。

而這場競爭的終點，或許正是AGI的曙光。

參考資料：

https://qwenlm.github.io/zh/blog/

https://seed.bytedance.com/zh/

https://platform.stepfun.com/

https://www.deepseek.com/

https://zhipuai.cn/

https://chat.z.ai

dignews.cc

國產大模型「五強爭霸」，決戰AGI！

新智元報道

相關文章

對話階躍星辰創始人：2年發16款多模態模型，實現AGI的必經之路

前腳開源最強多模態，後腳曬頂流朋友圈，階躍星辰為大模型應用下了一盤大棋

基座大模型「六進二」：南階躍，北智譜

最低調「六小虎」階躍星辰開年首秀：Agent落地智慧終端，印奇也來了

2個月拿下4大賽道頭部玩家，階躍搶先交出Agent戰場最硬核答卷

對話階躍星辰創始人姜大昕：多模態模型還沒出現GPT-4時刻，堅持追求「智慧上限」

大模型“四虎”出山，亮相4月QCon北京站

座艙與智駕“雙輪驅動”，芯擎科技打造智慧汽車“芯”標杆

最大引數300億！階躍星辰與吉利聯合開源兩款多模態大模型

階躍Agent生態首曝光：手機汽車IoT機器人全覆蓋，千行百業唰唰落地