中國AI新突破:國內首個自研萬卡叢集點亮,重塑全球算力格局

當全球人工智慧競賽進入深水區,算力已成為推動大模型發展的核心引擎。
近日,百度智慧雲成功點亮崑崙芯三代萬卡叢集,成為國內首個正式落地的自研萬卡級AI計算平臺。更值得關注的是,百度計劃進一步擴充套件至3萬卡叢集,為中國AI產業提供強勁動力。這一里程碑式的突破,不僅再次印證了百度在自研晶片與算力架構上的領先優勢,也向世界展示了中國AI技術的高效低成本路徑。
可加入我們讀者群參與討論:👇👇👇 
近日,百度智慧雲宣佈成功點亮崑崙芯三代萬卡叢集,成為國內首個正式落地的自研萬卡叢集。這一突破不僅標誌著中國在超大規模AI算力領域邁出關鍵一步,更預示著國產大模型將加速邁向高效低成本的黃金時代。據悉,百度智慧雲計劃進一步擴充套件至3萬卡叢集,為中國AI產業注入更澎湃的算力動能。

萬卡叢集

在全球AI競賽中,算力成本始終是制約大模型發展的核心難題。百度透過自研晶片與萬卡叢集的協同創新,實現了兩大關鍵突破:
1. 訓練效率躍升:千億引數模型的訓練週期大幅縮短,可支撐Sora類多模態應用的開發需求;
2. 叢集效能革命:動態資源切分技術讓單叢集同時訓練多個輕量化模型,通訊最佳化與容錯機制將算力浪費降至最低,訓練成本實現指數級下降。
資料顯示,百度萬卡叢集透過混合部署訓練、微調、推理任務,將叢集綜合利用率提升至新高度,主流開源模型訓練效率(MFU)達到58%,有效訓練率更突破98%。中國工程院院士鄭緯民評價稱:“構建國產自主萬卡系統雖充滿挑戰,但至關重要。”
過去,國內在建設超大規模算力叢集時,常面臨多芯混訓、功耗激增、拓撲結構限制等難題。而百度百舸AI異構計算平臺4.0的升級,為萬卡叢集的成功點亮提供了關鍵技術支撐:
  • 硬體突破:解決卡間互聯拓撲瓶頸,提升通訊頻寬利用率至90%以上。
  • 能效最佳化:透過創新散熱方案,降低萬卡級叢集的能耗,最佳化整體功耗管理。
  • 穩定性保障:採用百度自研BCCL(百度集合通訊庫),單卡故障恢復時間由小時級縮短至分鐘級,確保AI任務的持續穩定執行。
  • 跨地域高效排程:百舸4.0構建十萬卡級超大規模HPN高效能網路,解決長距離AI任務的通訊延遲問題,保障超低延遲的高效計算能力。
透過百舸4.0的強大算力整合能力,不僅提升了百度自身的AI競爭力,也為整個行業帶來了低成本高效算力的新正規化。
國產萬卡叢集的自主可控特性,正在降低企業AI開發門檻:
  • 教育領域:好未來“九章大模型”依託百舸平臺,將智慧學習機響應速度提升3倍;
  • 能源行業:中國石化、中海石油透過混合算力排程,實現勘探資料處理效率飛躍;
  • 多模態突破:生數科技Vidu大模型在百度支援下,素材渲染加速效率提升51倍。
百度萬卡叢集的成功點亮,不僅在國內引發廣泛關注,也在國際市場掀起熱議。花旗銀行在研報中指出百度、DeepSeek等中國AI企業展現出的高效與低成本優勢,將有助於加速全球AI應用開發,並推動人工智慧進入下一個拐點。
資本市場的積極反應也進一步印證了這一觀點——百度在港股、美股雙雙上漲,展現出市場對中國AI技術前景的高度認可。可以預見,隨著3萬卡叢集的進一步落地,中國AI產業將在全球範圍內贏得更大的市場話語權。
人工智慧的競爭,本質上是算力、演算法和資料的競爭。百度智慧雲透過自研晶片與高效算力叢集的結合,不僅提升了自身的AI研發能力,也為整個行業提供了降本增效的新方向。在生成式AI浪潮下,中國科技企業正在從技術追隨者新航路的開闢者邁進。
從晶片自研到萬卡叢集點亮,百度智慧雲再次證明了中國科技“花小錢辦大事”的智慧。當算力成本不再成為桎梏,產業創新的火花必將加速迸發——這或許正是中國AI邁向“叢集效能最大化”時代的最佳註腳。
可加入我們讀者群參與討論:👇👇👇 


相關文章