國產大模型「五強爭霸」,決戰AGI!


新智元報道  

編輯:編輯部 HYZ
【新智元導讀】中國基礎大模型市場,徹底變天了!如今牌桌上的玩家已經變成了「基模五強」——位元組、阿里、階躍星辰、智譜和DeepSeek。接下來的巔峰之戰,關鍵制勝點又會在哪裡?
DeepSeek的橫空出世,已經徹底改變了全球的AI局勢。
從此,不僅中美大模型競爭格局改變,國產大模型的產業版圖,也被一舉打破!
縱觀中國基礎大模型的市場,可以看到,如今的基礎大模型版圖已然改天換地,演變為全新的五強格局——
位元組、阿里、階躍星辰、智譜,以及DeepSeek。

新基模五強突圍,下一個制勝點在哪?
脫穎而出的這五強,為何能成為留在最後的玩家?
答案很簡單——要麼有錢,要麼有人。
前者,道理不言自明。訓練大模型是明牌重注,要麼得自家有糧,要麼就得有大腿。
像位元組、阿里、DeepSeek,都屬於有糧的型別;而智譜和階躍星辰,則無疑屬於後者。
其中,上海隊的階躍星辰,最新一輪融資發生在24年底至25年初,B輪已融資數億美金;北京隊的智譜,在2025年3月已經拿下18億人民幣的融資。
而說到人,當然就是高密度人才,尤其要有行業認可的技術領軍人物。
我們仔細盤盤就能發現,五強在這方面是分足鼎立,各有骨幹。
位元組的吳永輝,阿里的吳泳銘、周靖人,階躍星辰的姜大昕、張祥雨、朱亦博,智譜的唐傑、張鵬,DeepSeek的梁文鋒,都是在業界足以撼動局勢的人物。

滿足了有錢又有人,在這方面起跑線上各家都差不多,接下來要比拼的,就是硬貨了。

基模五強,各領風騷
其實仔細分析,就能發現這五強的共性。
要麼是全才,模型的能力要能做到全面覆蓋,且效能在第一梯隊。要麼就是專才,模型在某一方面遙遙領先。

阿里:開源王者,全球第三
阿里以「開源王者」的獨特定位,不僅在國內市場佔據重要席位,更在全球AI開源生態中,穩居全球TOP 3模型貢獻者。
斯坦福2025年人工智慧指數報告
可以說,阿里是國內過最開源自研LLM網際網路巨頭,也是全球唯一一家實現「全尺寸、全模態」開源的雲計算廠商。
可以說,作為開源最早、最完整的大公司,阿里在AI的投入上最堅決,也是如今佈局最全、最先賺到錢的中國網際網路大廠。
自2023年以來,通義團隊累積開源200+模型,涵蓋了千問(Qwen)大語言模型和萬相(Wan)視覺生成模型兩大基座系列。
這些模型覆蓋了文字生成、視覺/語音理解生成、文生圖,以及影片生成等全模態,引數規模從0.5B到235B不等,跨越119種語言及方言。
兩年前,國內LLM市場尚處於「百模」混戰階段,阿里率先將Qwen-7B開源,吸引了全球開發者的關注。
截至目前,Qwen全球下載量超3億,衍生模型數量超10萬,超越Llama成為全球第一開源模型。
在Hugging Face社群,2024年Qwen系列佔全球模型下載量的30%以上,穩居第一。
25年2月,Hugging Face全球開源大模型榜單中,排名前十開源模型全部基於Qwen二次開發
在這場「燒錢」的遊戲中,未來三年,阿里還將投入3800億元用於AI研發,用於雲和AI硬體基礎設施,總額超過去十年總和。
這一投入規模在國內網際網路公司中首屈一指,恰恰展現了阿里在AI賽道上的戰略決心。
相較於其他大模型玩家,阿里憑藉成熟的商業化路徑和廣泛的客戶基礎,率先實現了投入到回報的閉環。
截止2025年1月底,透過阿里雲百鍊平臺呼叫通義大模型API的企業已超過29萬。

位元組:巨型航母,重回創業
位元組的大模型以「綜合能力強」為特色,覆蓋了文字生成、影像理解、影片生成、語音處理等多模態領域。
在這場技術與資源的巔峰對決之中,位元組不僅在自研大模型和AI應用領域,展現出了「兇殘的戰鬥力」。
目前,位元組旗下的AI應用超20多款,爆火核心產品「豆包」憑藉其強大文字生成和多模態能力,迅速佔領使用者心智,月活使用者超1億。
影片生成工具「即夢」也被賦予了更高的戰略優先順序,已在虛擬偶像、電商直播等領域,實現商業化落地。
同樣,位元組在AI程式設計領域不敢落後。他們推出的AI程式設計工具Trae,直接對標Cursor等AI整合開發環境。
在企業服務方面,基於豆包大模型,火山引擎「飛連」也在多場景落地AI應用等。
位元組的全面佈局,還體現在其生態整合能力上。透過抖音、今日頭條、飛書等平臺,位元組將大模型嵌入到內容推薦、協同辦公中,形成了技術到應用的生態閉環。
而如今,位元組以「巨型航母重回創業」姿態,憑藉雄厚資金、超高人才密度、多方向全面佈局,成為中國AI賽道領跑者之一。

階躍星辰:低調的大模型國家隊
跟其他家相比,階躍星辰可以算是這五強中最低調的大模型國家隊了。
可以說,階躍星辰是生於上海、長於上海的國家隊。2024年底,階躍星辰完成了總額達數億美元的融資,核心投資方包括上海國有資本投資有限公司及其旗下基金,戰略和財務投資人包括騰訊投資、五源資本、啟明創投等。
如今,才成立2年的階躍星辰,已累計釋出22款自研基座模型,覆蓋文字、語音、影像、影片、音樂、推理,其中有16款是多模態模型,效能領跑全行業,成為行業內公認的「多模態卷王」。
其中,Step-1o Vision便在2025年初分別在知名大模型競技場Chatbot Arena和國內權威評估平臺「司南」(OpenCompass)中,分別拿下了視覺領域中國大模型第一,以及多模態模型榜單第一的成績。
更難得的是,階躍星辰的多模態矩陣既全面,又在全行業領先。要知道,多模態模型的核心,就是綜合能力,既要求語音、圖片、影片多個模態的能力,又要求模型能理解、生成、推理。在此佈局上,階躍星辰的每條線都達到了第一梯隊。
而多模還有一大難點,就是融合過程中不能損失單個模特的效能,尤其不能降智。而階躍星辰採取了原生多模的方式,在此方面經驗獨到。
在階躍星辰看來,多模態是通往AGI的必經之路。隨著多模態互動和推理的融合愈加成熟,更多Agent會在智慧終端上湧現。
現在,階躍星辰正在發力徹底解決視覺領域根本難題——表徵和對齊的基礎問題,也即「predict next frame」。
未來,按照階躍星辰的多模研發路徑,AI將能建模物理世界互動,模擬整個世界,構建世界模型。至此,AGI就將實現。
在成立之初,姜大昕團隊曾繪製過這樣一幅智慧演進路線圖,將智慧進化分為模擬世界、探索世界、歸納世界三個階段
與此同時,階躍星辰的核心技術人員已經在一線親歷十年AI發展,這支隊伍的人才密度極高,既有技術洞察,又有實戰經驗,堪稱是基模的「夢之隊」。
其中,創始人、CEO姜大昕曾擔任微軟全球副總裁,微軟亞洲網際網路工程院副院長、首席科學家。入選2025年IEEE Fellow的姜大昕博士,是唯一來自中國大模型創業公司的入選者。
而首席科學家張祥雨,其參與著作的《用於影像識別的深度殘差學習》論文(ResNet)是21世紀以來全球被引用次數最多的論文,引用量已超過25萬次。
商業化方面,目前已有多家頭部企業和大量AI應用開發者對階躍的多模態模型表示認可,紛紛接入。同時,階躍還將智慧終端Agent視為大模型落地的核心突破點,已和吉利汽車、千里科技、OPPO、智元機器人、原力靈機、TCL等達成了深度合作

智譜:全棧創新,發力智慧體
作為國內首個開啟IPO大模型創業公司,智譜背靠清華技術底蘊以「學院派」獨特氣質脫穎而出,在基座模型、多模態技術和智慧體展開全面佈局。
目前,智譜已經建立了新一代認知大模型技術體系,研發了全棧自主GLM系模型,效能指標與國際頂尖LLM對齊。
去年8月,GLM-4-Plus問世在多個任務上表現優異,與GPT-4系不相上下。
今年4月,智譜再次開源32B/9B系列GLM模型,包括基座、推理和沉思模型。以320億引數比肩千億引數主流模型效能。
其中的GLM-Z1-Rumination沉思模型,便是智譜對AGI下一代技術的最新探索。
在智慧體方面,智譜先於OpenAI提出Phone Use概念並推出Agent產品,併發布了全球首個集深度研究與實際操作於一體L3級智慧體——AutoGLM沉思。
如今,他們正憑藉AutoGLM及GLM-PC與全球車企、PC及手機廠商展開深度合作,推動大模型從Chat走向Act。
智譜的商業化路徑以2G和2B業務為核心,深度繫結政府和企業需求。
其構建了MaaS私有化部署和智慧體平臺等服務模型,形成了包含百萬規模開發者的模型服務新生態。
據統計,MaaS平臺支撐80餘萬企業、應用開發者。
這種學院派創業模式,使得智譜在技術深度和戰略穩定上,佔據領先優勢。

DeepSeek:研究導向,厚積薄發
DeepSeek,則是五強中目前最受國外矚目的一位。在中美AI競賽中,也是被提及最多、存在感最強的一家。
可以說,這是一位特立獨行的技術奇兵,直接以一己之力,掀翻了大模型的牌桌。
DeepSeek技術的特點,就是聚焦語言模型,特別是數理能力,走堅定的開源路線。
上下滑動檢視
今年過年時,DeepSeek-R1給全世界帶來了億點點震撼,以極低的計算資源,取得了媲美GPT-4等頂級AI模型的效能。
相比OpenAI、Anthropic訓模型時動輒投入的數億美元資金、數萬張高階GPU,DeepSeek四兩撥千斤的核心秘訣,就在於下面這種極致的工程最佳化。
比如,MoE架構讓模型總引數量達到671B,而在執行時卻只需啟用37B,大幅降低了計算需求;多token預測(MTP),則提高了AI的訓練效率,避免逐字預測;多頭潛注意力(MLA),讓模型更精準地分配了計算資源。
總之,DeepSeek成功的關鍵,就在於偏研究型的導向,而非以盈利為短期目標。從研究角度鼓勵工程師提效,不必面臨財務變現壓力。
而DeepSeek團隊,也匯聚了多位頂尖人才。創始人梁文鋒,在用人上也有著自己獨特的原則。
比如,以應屆和畢業一兩年的人才為主,不追求規模,而是構建小而精的團隊。
隨著大規模的破圈,雲廠商、行業夥伴紛紛積極接入,讓模型的生命力持續旺盛。
在DeepSeek的熱潮下,如今已經有億萬普通使用者開始擁抱AI。

決戰下一階段
「智慧上限」與「多模態能力」
當「基模五強」的格局初步形成,競爭的焦點也隨之轉向更為核心和前沿的技術領域。
技術決勝點,聚焦何處?
顯然,追求更高的「智慧上限」和突破的「多模態能力」,已成為通往AGI路上必須搶攻的兩大技術高地。
一方面,追求智慧的上限,仍是當下大模型領域最重要的事情。
當前領先的模型雖然在許多工中表現驚豔,但在邏輯推理、常識理解、長文字處理等方面,仍有較大的提升空間。
提升智慧上限的最終目標,是邁向能夠執行任何人類智力任務的AGI,這需要模型具備更深層次的理解、學習、推理和創造能力。
另一方面,多模態理解與生成的統一是走向AGI的必經之路。
人類透過多種感官與世界互動,並獲取資訊。要讓AI真正理解並融入複雜的世界,就必須賦予其處理和融合文字、影像、音訊、影片等多種模態資訊的能力。
當理解與生成統一,不僅能推動智慧體在智慧終端的普及,還能透過具身智慧與物理世界互動,自己收集環境資料,構建世界模型。
在世界模型的基礎上,再加上覆雜任務的規劃、抽象概念歸納的能力,強化學習演算法能力,以及超級對齊能力,就有可能實現AGI。
總而言之,未來對更高智慧上限的無盡探索和多模態能力的深度融合,將是決定這場競賽勝負的關鍵。
如今站在AGI的門檻前,「基模五強」的競爭不僅是技術的較量,更是資源、人才、生態的全面博弈。
位元組、阿里、階躍星辰、智譜、DeepSeek這五大領軍者,正以其各自獨特的優勢和戰略遠見,引領中國AI不斷逼近世界前沿。
而這場競爭的終點,或許正是AGI的曙光。
參考資料:
https://qwenlm.github.io/zh/blog/
https://seed.bytedance.com/zh/
https://platform.stepfun.com/
https://www.deepseek.com/
https://zhipuai.cn/
https://chat.z.ai


相關文章