
當大模型從技術奇點向產業縱深演進,企業正面臨AI基礎設施的多重挑戰:既要透過私有化部署滿足資料隱私和安全需求,又要承載百億、千億引數規模的澎湃算力;既要應對動態演進的業務需求,又要平衡基礎設施的投入成本。
在這場智慧革命的發展浪潮中,“EasyStack+DeepSeek”、“雲+AI”充滿化學反應的組合,不僅是軟硬體技術的簡單疊加,更是智慧時代基礎設施與上層應用的深度交響——EasyStack為使用者提供可"彈性生長"的AI基礎設施架構,讓每個企業都能找到專屬的智慧進化路徑。
EasyStack雲基礎設施如同具備"生命體徵"的數字基座,為DeepSeek大模型提供了全維度的進化支撐:從最小1個算力節點的輕量化部署,到支撐671B超大規模引數的算力承載;從X86、海光、ARM等多元算力的靈活排程,到雲主機、容器、裸金屬等多種部署形態按需選擇,企業可以根據算力需求、業務階段和合規要求,像"拼樂高"般自由構建AI基礎設施。實現諸如在季度性業務高峰時,部署在EasyStack AI基礎設施上的DeepSeek模型算力資源可以橫向擴充套件,全程業務零中斷;或者從7B模型起步,隨著場景深化逐步擴充套件至671B規模,底層基礎設施透過"OTA"實現平滑持續進化。
從晶片到雲、到DeepSeek再到AGI應用均擁抱開源技術,EasyStack從創辦以來一直的理念就是開源生態產品化,擁抱Linux、OpenStack、Docker、K8S、Ceph等主流基礎架構開源技術打造世界一流體驗的雲計算產品。開源,在智慧時代正在以開放協作的化學反應催生著更深更廣的技術革新與進化。EasyStack作為開源理念的踐行者,既是這場革命的參與者,更是開源生態進化規則的先行者,在智慧時代持續擁抱開源DeepSeek的創新構建AI基礎設施。
在技術民主化的浪潮中,最具生命力的不是某個"超級大腦",而是讓每個智慧個體都能自由連線、共同進化的生態土壤。開源生態,使得從晶片物理層、到Cloud和AI基礎設施層、再到AGI認知層的技術進化,不再是封閉實驗室裡的孤島實驗,而是演變為全球開發者共同參與的"生命工程"。
EasyStack+DeepSeek,這套架構真正實現了"生長型AI"的核心理念:透過模組化設計的EasyStack AI基礎設施底座,企業既可在單算力節點上完成DeepSeek私有化部署的業務啟動,也能透過積木式擴充套件構建千卡叢集;既可以支援NVIDIA算力生態,也為國產算力晶片提供了相容介面;其獨有的"無感升級"能力,讓底層架構的迭代與上層模型的進化始終同頻共振。這種"從1到N"的彈性生長模式,使得AI基礎設施不再是沉重的成本中心,而是真正具備生命力的價值創造引擎。
一、EasyStack 漸進式可進化 AI 基礎設施

(1)既有EasyStack雲基礎設施平滑實現DeepSeek熱插拔
對於已經部署EasyStack雲基礎設施的使用者,通往私有化部署DeepSeek大模型的最短路徑早已鋪就——無需顛覆既有架構,不必經歷資料遷移陣痛,透過"熱升級+積木式擴充套件"的產品能力,即可在現有EasyStack雲平臺上無縫構建DeepSeek專屬智慧引擎。即使對於已部署的EasyStack雲基礎設施比較早期的版本,使用者也可以透過產品平滑無感升級能力,進化到可支援DeepSeek私有化部署的最新版本,業務系統全程零感知,而後基於使用者所希望的部署算力型別,按需擴充套件啟用DeepSeek GPU算力池,實現基於雲主機、裸金屬容器或者裸金屬伺服器的DeepSeek私有化部署落地,整個過程如同為現有基礎設施安裝"大模型外掛"。
EasyStack 雲基礎設施可以提供雲主機或裸金屬容器部署DeepSeek推理系統,雲主機或裸金屬容器按需掛載GPU裝置,如果單個雲主機或裸金屬容器效能不夠,可以部署多個相同模型的雲主機或裸金屬容器,透過EasyStack雲基礎設施的負載均衡元件實現效能提升。
EasyStack 雲基礎設施也可以提供裸金屬伺服器部署DeepSeek,使用者可以選擇透過裸金屬服務建立包含GPU的裸金屬節點,在裸金屬節點完成DeepSeek的部署。對於單臺裸金屬伺服器來說,如果伺服器配置比較高,比如8塊H200 GPU,可以支撐部署中大規模的DeepSeek。當單臺裸金屬伺服器配置不足時,可以部署多個相同DeepSeek模型的裸金屬伺服器,透過EasyStack雲基礎設施的負載均衡元件實現效能提升。如果使用者購買了大模型一體機,一體機中假如預安裝了作業系統與大模型軟體,EasyStack雲基礎設施也可以透過裸金屬納管功能管理一體機,同時也可以使用EasyStack雲基礎設施的負載均衡元件、Proton二層橋接功能接入雲內網路實現效能提升與統一網路。
(2)新建EasyStack AI基礎設施實現DeepSeek私有化落地
對於尚未構建EasyStack雲基礎設施的企業,或者希望透過獨立建設方式實現DeepSeek私有化落地的既有使用者,可以透過全新部署的EasyStack AI基礎設施底座實現DeepSeek從7B到671B引數的靈活承載。該平臺透過預置的智慧資源池化技術,在初始部署階段即開箱實現CPU/GPU異構算力、分散式儲存、高速網路的全棧融合,使DeepSeek千億級大模型可在最短時間內完成從硬體上架到推理服務釋出的全流程;與此同時,其開放式架構設計預留了多維業務介面,同一資源池既可執行DeepSeek智慧引擎,也可並行支撐傳統業務應用,真正實現"一池多用"。這種"大模型+多元負載"的共生模式,不僅避免了傳統煙囪式建設的資源浪費,更讓企業每一份算力投入都轉化為可疊加的智慧勢能。
(3)解鎖DeepSeek私有化部署的"引數無界×架構無界×形態無界"新正規化
EasyStack AI基礎設施以"三層視角"定義DeepSeek私有化部署邊界:在引數維度,平臺透過排程引擎,實現從7B輕量化推理到671B超大規模的全引數規模承載,單叢集可執行不同引數規模的DeepSeek模型例項;在架構維度,其異構融合架構創新性地打通x86、海光、ARM等多種算力生態,在同一套EasyStack AI基礎設施底座中,使用者可以靈活選擇DeepSeek私有化部署的架構形態;在算力種類維度,平臺支援"三位一體"部署模式,可以靈活根據業務算力型別需求,選擇透過雲主機/裸金屬容器/裸金屬等不同算力種類承載DeepSeek,三種形態可根據業務場景自由選擇。
這種打破引數、架構、形態三重邊界的實踐,真正實現了"一套底座,按需選擇,多樣場景"的智慧進化圖景。
對於使用者而言,DeepSeek從小到大、成本從低到高漸進式的落地,並隨業務發展而不斷最佳化調整是一條推薦路徑,EasyStack透過雲主機、物理機/一體機、裸金屬容器部署DeepSeek來滿足使用者不同建設場景下的漸進式需求,在這個過程中,使用者可以不斷理解並用好DeepSeek來落地從簡單業務到核心業務的過程,EasyStack AI基礎設施平臺也不斷進化來滿足更加多樣化的業務需求。
(4)統一SDN網路和負載均衡——構築大模型時代的"神經中樞+智慧血管"系統
基於軟體定義網路構建的雲網絡Proton,不僅為DeepSeek大模型提供網路通道保障,還可與EasyStack AI基礎設施平臺承載的其他業務系統實現網路策略統一管理,提升網路資源配置的靈活性、彈性和效率。針對DeepSeek從7B到671B的全譜系模型,平臺內建負載均衡元件,透過智慧流量演算法將請求精準分發至最優計算節點。無論是輕量級7B模型,還是671B大規模模型,均可透過統一負載均衡元件實現流量智慧排程,統一負載均衡元件可統一支援雲主機、裸金屬容器和裸金屬等不同部署形態的DeepSeek的負載均衡需求。
(5)智慧基座永續進化:OTA無感升級與基於使用者反饋最佳化的AI基礎設施
EasyStack AI基礎設施以"進化即服務"為理念,構建了具備生物式新陳代謝能力的智慧底座。透過OTA進化引擎,平臺可像智慧手機升級系統般實現AI基礎設施底座的持續蛻變——當新一代智慧排程演算法或其他智慧元件釋出時,管理員僅需一鍵觸發"進化模式",在保障業務零中斷的前提下,完成從晶片驅動到平臺元件的原子化更新。平臺新特性、新功能的開發,以及已有能力的調優,充分吸收使用者投產環境的生產實踐反饋。EasyStack AI基礎設施將以永不停歇的進化姿態,重新定義智慧時代的基礎設施底座生命力法則,為使用者提供一套"越用越聰明"的有機基礎設施。

EasyStack AI基礎設施支撐DeepSeek 按需引數/按需架構/按需形態部署
二、推薦硬體配置
此為EasyStack AI基礎設施的基準推薦配置,適用於大多數企業級AI推理場景的共性需求。需要特別說明的是,真正的智慧基礎設施不應止步於標準模板,EasyStack技術團隊基於"場景穿透式設計"方法論,可為使用者提供從晶片選型到拓撲設計的契合具體業務場景和需求的推薦配置,歡迎聯絡EasyStack,為您量身鍛造完全契合業務需求的智慧基座。
(1)已有云基礎設施擴容推薦配置——DeepSeek 7B/32B/70B/671B(面向推理)
對於已經部署EasyStack雲基礎設施的使用者,可以透過平滑升級和擴容的方式,在現有EasyStack雲平臺上無縫構建DeepSeek推理執行環境。
對7B/32B引數規模的DeepSeek,可以選擇使用雲主機算力或裸金屬容器算力承載DeepSeek,在現有云基礎設施上擴容最少1臺配置GPU的算力節點即可完成環境構建。
7B擴容的算力節點推薦配置如下:
計算節點/裸金屬容器節點-GPU伺服器
|
1臺
|
CPU
|
x86:2*24C
|
單顆CPU≥24C 主頻≥2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16x 32GB DDR4/DDR5ECC RDIMM
|
單臺記憶體≥512G
|
||
RAID卡
|
1 x 12Gb/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式
|
||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
10G網絡卡
|
4 x 10Gb 連線網口,含多模光模組
|
–
|
||
GPU
|
1~2*GPU(GPU數量取決於視訊記憶體配置)
|
總視訊記憶體≥40GB
|
||
x86:L20(48G)*1或RTX 4090(24G,消費級顯示卡)*2
|
||||
Arm:昇騰Atlas 300I Pro(24G)*2
|
||||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
DeepSeek資料盤(選配)
|
(選配)伺服器本地NVME 1塊,總容量≥800G。需確保計算節點架構與控制節點為同架構。
|
這種儲存配置作為選配方案,以伺服器本地NVME儲存DeepSeek模型檔案,適用於靜態推理場景不對模型檔案進行微調或其他調整。
|
||
其它
|
2U 機架式伺服器、2 冗餘電源
|
–
|
32B擴容的算力節點推薦配置如下:
計算節點/裸金屬容器節點-GPU伺服器
|
1臺
|
CPU
|
x86:2*28C
|
單顆CPU≥28C 主頻≥2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16x 32GB DDR4/DDR5ECC RDIMM
|
單臺記憶體≥512G
|
||
RAID卡
|
1 x 12Gb/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式
|
||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
25G網絡卡
|
4 x 25Gb 連線網口,含多模光模組
|
推薦:MellanoxConnectX® -4/4 Lx 、5、6 EN
|
||
GPU
|
4*GPU(GPU數量取決於視訊記憶體配置)
|
總視訊記憶體≥128GB
|
||
x86:L20(48G)*4或RTX 6000 Ada(48G,消費級顯示卡)*4
|
||||
Arm:昇騰Atlas 300I *4
|
||||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
DeepSeek資料盤(選配)
|
(選配)伺服器本地NVME 1~4塊,總容量≥4TB。需確保計算節點架構與控制節點為同架構。
|
這種儲存配置作為選配方案,以伺服器本地NVME儲存DeepSeek模型檔案,適用於靜態推理場景不對模型檔案進行微調或其他調整。
|
||
其它
|
2U 機架式伺服器、2 冗餘電源
|
–
|
對70B/671B引數規模的DeepSeek,推薦使用裸金屬容器算力承載DeepSeek,在現有云基礎設施上擴容最少1臺配置GPU的算力節點即可完成環境構建。
70B擴容的算力節點推薦配置如下(擴容1臺或2臺GPU算力節點):
裸金屬容器節點-GPU伺服器
|
1臺
|
CPU
|
x86:2*40C
|
單顆CPU≥40C 主頻≥2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16x 64GB DDR4/DDR5ECC RDIMM
|
單臺記憶體≥1024G
|
||
RAID卡
|
1 x 12Gb/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式
|
||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
25G網絡卡
|
4 x 25Gb 連線網口,含多模光模組
|
推薦:MellanoxConnectX® -4/4 Lx 、5、6 EN
|
||
GPU
|
4~8*GPU(GPU數量取決於視訊記憶體配置)
|
單臺視訊記憶體≥384GB
|
||
x86:L20(48G)*8或H20(96G)*4或RTX 6000 Ada(48G,消費級顯示卡)*8
|
||||
Arm:昇騰910b(64G)*8
|
||||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
DeepSeek資料盤(選配)
|
(選配)伺服器本地NVME,磁碟數量按單盤規格和總容量需求,總容量≥10T。
|
這種儲存配置作為選配方案,以伺服器本地NVME儲存DeepSeek模型檔案,適用於靜態推理場景不對模型檔案進行微調或其他調整。
|
||
其它
|
2U 機架式伺服器、2 冗餘電源
|
–
|
裸金屬容器節點-GPU伺服器
|
2臺
|
CPU
|
x86:2*40C
|
單顆CPU≥40C 主頻≥2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16x 64GB DDR4/DDR5ECC RDIMM
|
單臺記憶體≥1024G
|
||
RAID卡
|
1 x 12Gb/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式
|
||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
25G網絡卡
|
4 x 25Gb 連線網口,含多模光模組
|
推薦:MellanoxConnectX® -4/4 Lx 、5、6 EN
|
||
100G網絡卡
|
2 x 100Gb 連線網口,含多模光模組
|
需支援RoCEv2
|
||
GPU
|
2~8*GPU(GPU數量取決於視訊記憶體配置)
|
單臺視訊記憶體≥192GB
|
||
x86:L20(48G)*4或H20(96G)*2或RTX 6000 Ada(48G,消費級顯示卡)*4
|
||||
Arm:昇騰Atlas 300I Pro(24G)*8或昇騰昇騰910b(64G)*4
|
||||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
DeepSeek資料盤(選配)
|
(選配)伺服器本地NVME,磁碟數量按單盤規格和總容量需求,總容量≥10T。
|
這種儲存配置作為選配方案,以伺服器本地NVME儲存DeepSeek模型檔案,適用於靜態推理場景不對模型檔案進行微調或其他調整。
|
||
其它
|
2U 機架式伺服器、2 冗餘電源
|
–
|
671B擴容的算力節點推薦配置如下(擴容1臺、2臺或4臺GPU算力節點):
裸金屬容器節點-GPU伺服器
|
1臺
|
CPU
|
x86:2*50C
|
單顆CPU≥50C 主頻≥2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16x 256GB DDR4/DDR5ECC RDIMM
|
單臺記憶體≥3072G
|
||
RAID卡
|
1 x 12Gb/s RAID 控制卡
|
支援RAID levels 0, 1,JBOD模式
|
||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
25G網絡卡
|
4 x 25Gb 連線網口,含多模光模組
|
–
|
||
GPU
|
8*GPU(GPU數量取決於視訊記憶體配置)
|
單臺視訊記憶體≥1128GB
|
||
x86:H200(141G)*8
|
||||
Arm:不支援單節點部署671B
|
||||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
DeepSeek資料盤(選配)
|
(選配)伺服器本地NVME,磁碟數量按單盤規格和總容量需求,總容量≥40T。
|
這種儲存配置作為選配方案,以伺服器本地NVME儲存DeepSeek模型檔案,適用於靜態推理場景不對模型檔案進行微調或其他調整。
|
||
其它
|
2U 機架式伺服器、2 冗餘電源
|
–
|
裸金屬容器節點-GPU伺服器
|
2臺
|
CPU
|
x86:2*50C
|
單顆CPU≥50C 主頻≥2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16x 128GB DDR4/DDR5ECC RDIMM
|
單臺記憶體≥2048G
|
||
RAID卡
|
1 x 12Gb/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式
|
||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
25G網絡卡
|
4 x 25Gb 連線網口,含多模光模組
|
–
|
||
100G網絡卡
|
2 x 100Gb 連線網口,含多模光模組
|
需支援RoCEv2
|
||
GPU
|
8*GPU(GPU數量取決於視訊記憶體配置)
|
單臺視訊記憶體≥768GB
|
||
x86:H20(96G)*8 或H200(141G)*8
|
||||
Arm:不支援2節點部署671B
|
||||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
DeepSeek資料盤(選配)
|
(選配)伺服器本地NVME,磁碟數量按單盤規格和總容量需求,總容量≥40T。
|
這種儲存配置作為選配方案,以伺服器本地NVME儲存DeepSeek模型檔案,適用於靜態推理場景不對模型檔案進行微調或其他調整。
|
||
其它
|
2U 機架式伺服器、2 冗餘電源
|
–
|
裸金屬容器節點-GPU伺服器
|
4臺
|
CPU
|
x86:2*50C
|
單顆CPU≥50C 主頻≥2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16x 128GB DDR4/DDR5ECC RDIMM
|
單臺記憶體≥2048G
|
||
RAID卡
|
1 x 12Gb/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式
|
||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
25G網絡卡
|
4 x 25Gb 連線網口,含多模光模組
|
–
|
||
100G網絡卡
|
2 x 100Gb 連線網口,含多模光模組
|
需支援RoCEv2
|
||
GPU
|
4~8*GPU(GPU數量取決於視訊記憶體配置)
|
單臺視訊記憶體≥480GB
|
||
x86:H20(96G)*8 或H200(141G)*4
|
||||
Arm:華為昇騰910b (64G)*8
|
||||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
DeepSeek資料盤(選配)
|
(選配)伺服器本地NVME,磁碟數量按單盤規格和總容量需求,總容量≥40T。
|
這種儲存配置作為選配方案,以伺服器本地NVME儲存DeepSeek模型檔案,適用於靜態推理場景不對模型檔案進行微調或其他調整。
|
||
其它
|
2U 機架式伺服器、2 冗餘電源
|
–
|
(2)新建EasyStack AI基礎設施推薦配置——DeepSeek 7B/32B/70B/671B(面向推理)
對於新建基礎設施場景,EasyStack提供靈活方案供使用者選擇。小引數規模的DeepSeek私有部署,如7B/32B,DeepSeek算力節點可以選擇採用雲主機部署或者裸金屬容器部署兩種方式;對於70B/671B引數規模的DeepSeek,推薦使用裸金屬容器方式承載DeepSeek。無論採用哪種方案新建EasyStack AI基礎設施,同一資源池既可執行DeepSeek智慧引擎,也可並行支撐傳統業務應用,最最佳化投入產出比。
7B引數規模新建AI基礎設施場景,透過雲主機承載DeepSeek的推薦配置如下:
融合節點-GPU伺服器
|
1臺
|
CPU
|
x86:2*24C
|
單顆CPU≥24C 主頻≥2.2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2.2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16 x 32GB DDR4/DDR5 ECC RDIMM
|
單臺記憶體≥512G
|
||
RAID卡
|
1 x 24/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式;
|
||
建議PCIE4.0及以後 x8規格卡
|
||||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
10G網絡卡
|
4 x 10Gb 連線網口,含多模光模組
|
用於網路節點複用時,需支援智慧網絡卡解除安裝GENEVE。
|
||
GPU
|
1~2*GPU(GPU數量取決於視訊記憶體配置)
|
總視訊記憶體≥40GB
|
||
x86:L20(48G)*1或RTX 4090(24G,消費級顯示卡)*2
|
||||
Arm:昇騰Atlas 300I Pro(24G)*2
|
||||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
DeepSeek資料盤(選配)
|
(選配)伺服器本地NVME 1塊,總容量≥800G。需確保計算節點架構與控制節點為同架構。
|
這種儲存配置作為選配方案,以伺服器本地NVME儲存DeepSeek模型檔案,適用於靜態推理場景不對模型檔案進行微調或其他調整。
|
||
快取盤
|
4 x 960G 2.5英寸 SSD
|
DWPD≥3;
|
||
單盤≥960GB
|
||||
AL Cache Tier
|
2 x 3.2+TNVME SSD
|
DWPD≥3;
|
||
AL Cache Tier 層與資料盤層裸容量比例≥1:12;AL Cache Tier 層需配置NVME SSD。
|
||||
推薦型號:IntelP5620,更多型號參見後續會發布磁碟的相容性清單。
|
||||
資料盤
|
10 x 8TB 3.5英寸 HDD
|
1TB≤單盤≤12TB,單節點硬碟數量4-12塊,單節點資料盤總裸容量≤120T。
|
||
機械盤轉速≥7200 RPM。
|
||||
其它
|
2U 機架式伺服器、2 冗餘電源
|
–
|
||
融合節點-通用伺服器
|
2臺
|
CPU
|
x86:2*24C
|
單顆CPU≥24C 主頻≥2.2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2.2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16 x 32GB DDR4/DDR5 ECC RDIMM
|
單臺記憶體≥512G
|
||
RAID卡
|
1x 24Gb/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式;
|
||
建議PCIE4.0及以後 x8規格卡
|
||||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
10G網絡卡
|
4x 10Gb 連線網口,含多模光模組
|
用於網路節點複用時,需支援智慧網絡卡解除安裝GENEVE。
|
||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
快取盤
|
4x 960G 2.5英寸 SSD
|
DWPD≥3;
|
||
單盤≥960GB
|
||||
AL Cache Tier
|
2x 3.2+T NVME SSD
|
DWPD≥3;
|
||
AL Cache Tier 層與資料盤層裸容量比例≥1:12;AL Cache Tier 層需配置NVME SSD。
|
||||
推薦型號:IntelP5620,更多型號參見後續會發布磁碟的相容性清單。
|
||||
資料盤
|
10x 8TB 3.5英寸 HDD
|
1TB≤單盤≤12TB,單節點硬碟數量4-12塊,單節點資料盤總裸容量≤120T。
|
||
機械盤轉速≥7200 RPM。
|
||||
其它
|
2U 機架式伺服器、2 冗餘電源
|
–
|
7B引數規模新建AI基礎設施場景,透過裸金屬容器承載DeepSeek的推薦配置如下:
融合節點-通用伺服器
|
3臺
|
CPU
|
x86:2*24C
|
單顆CPU≥24C 主頻≥2.2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2.2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16 x 32GB DDR4/DDR5 ECC RDIMM
|
單臺記憶體≥512G
|
||
RAID卡
|
1 x 24Gb/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式;
|
||
建議PCIE4.0及以後 x8規格卡
|
||||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
10G網絡卡
|
4 x 10Gb 連線網口,含多模光模組
|
用於網路節點複用時,需支援智慧網絡卡解除安裝GENEVE。
|
||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
快取盤
|
4 x 960G 2.5英寸 SSD
|
DWPD≥3;
|
||
單盤≥960GB
|
||||
AL Cache Tier
|
2 x 3.2+TNVME SSD
|
DWPD≥3;
|
||
AL Cache Tier 層與資料盤層裸容量比例≥1:12;AL Cache Tier 層需配置NVME SSD。
|
||||
推薦型號:IntelP5620,更多型號參見後續會發布磁碟的相容性清單。
|
||||
資料盤
|
10 x 8TB 3.5英寸 HDD
|
1TB≤單盤≤12TB,單節點硬碟數量4-12塊,單節點資料盤總裸容量≤120T。
|
||
機械盤轉速≥7200 RPM。
|
||||
其它
|
2U 機架式伺服器、2 冗餘電源
|
–
|
||
裸金屬容器節點-GPU伺服器
|
1臺
|
CPU
|
x86:2*24C
|
單顆CPU≥24C主頻≥2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16x 32GB DDR4/DDR5 ECC RDIMM
|
單臺記憶體≥512G
|
||
RAID卡
|
1 x 12Gb/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式
|
||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
10G網絡卡
|
4 x 10Gb 連線網口,含多模光模組
|
–
|
||
GPU
|
1~2*GPU(GPU數量取決於視訊記憶體配置)
|
總視訊記憶體≥40GB
|
||
x86:L20(48G)*1或RTX 4090(24G,消費級顯示卡)*2
|
||||
Arm:昇騰Atlas 300I Pro(24G)*2
|
||||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
DeepSeek資料盤(選配)
|
(選配)伺服器本地NVME 1塊,總容量≥800G。
|
這種儲存配置作為選配方案,以伺服器本地NVME儲存DeepSeek模型檔案,適用於靜態推理場景不對模型檔案進行微調或其他調整。
|
||
其它
|
2U 機架式伺服器、2 冗餘電源
|
32B引數規模新建AI基礎設施場景,透過雲主機承載DeepSeek的推薦配置如下:
融合節點-GPU伺服器
|
1臺
|
CPU
|
x86:2*28C
|
單顆CPU≥28C 主頻≥2.2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2.2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16 x 32GB DDR4/DDR5 ECC RDIMM
|
單臺記憶體≥512G
|
||
RAID卡
|
1 x 24Gb/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式;
|
||
建議PCIE4.0及以後 x8規格卡
|
||||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
25G網絡卡
|
4 x 25Gb 連線網口,含多模光模組
|
用於網路節點複用時,需支援智慧網絡卡解除安裝GENEVE。
|
||
推薦:Mellanox ConnectX® -4/4 Lx 、5、6 EN
|
||||
GPU
|
4*GPU(GPU數量取決於視訊記憶體配置)
|
總視訊記憶體≥128GB
|
||
x86:L20(48G)*4或RTX 6000 Ada(48G,消費級顯示卡)*4
|
||||
Arm:昇騰Atlas 300I *4
|
||||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
DeepSeek資料盤(選配)
|
(選配)伺服器本地NVME 1~4塊,總容量≥4TB。需確保計算節點架構與控制節點為同架構。
|
這種儲存配置作為選配方案,以伺服器本地NVME儲存DeepSeek模型檔案,適用於靜態推理場景不對模型檔案進行微調或其他調整。
|
||
快取盤
|
4 x 960G 2.5英寸 SSD
|
DWPD≥3;
|
||
單盤≥960GB
|
||||
AL Cache Tier
|
2 x 3.2+TNVME SSD
|
DWPD≥3;
|
||
AL Cache Tier 層與資料盤層裸容量比例≥1:12;AL Cache Tier 層需配置NVME SSD。
|
||||
推薦型號:IntelP5620,更多型號參見後續會發布磁碟的相容性清單。
|
||||
資料盤
|
10 x 8TB 3.5英寸 HDD
|
1TB≤單盤≤12TB,單節點硬碟數量4-12塊,單節點資料盤總裸容量≤120T。
|
||
機械盤轉速≥7200 RPM。
|
||||
其它
|
2U 機架式伺服器、2 冗餘電源
|
–
|
||
融合節點-通用伺服器
|
2臺
|
CPU
|
x86:2*28C
|
單顆CPU≥28C 主頻≥2.2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2.2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16 x 32GB DDR4/DDR5 ECC RDIMM
|
單臺記憶體≥512G
|
||
RAID卡
|
1x 24Gb/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式;
|
||
建議PCIE4.0及以後 x8規格卡
|
||||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
25G網絡卡
|
4x 25Gb 連線網口,含多模光模組
|
用於網路節點複用時,需支援智慧網絡卡解除安裝GENEVE。
|
||
推薦:Mellanox ConnectX® -4/4 Lx 、5、6 EN
|
||||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
快取盤
|
4x 960G 2.5英寸 SSD
|
DWPD≥3;
|
||
單盤≥960GB
|
||||
AL Cache Tier
|
2x 3.2+T NVME SSD
|
DWPD≥3;
|
||
AL Cache Tier 層與資料盤層裸容量比例≥1:12;AL Cache Tier 層需配置NVME SSD。
|
||||
推薦型號:IntelP5620,更多型號參見後續會發布磁碟的相容性清單。
|
||||
資料盤
|
10x 8TB 3.5英寸 HDD
|
1TB≤單盤≤12TB,單節點硬碟數量4-12塊,單節點資料盤總裸容量≤120T。
|
||
機械盤轉速≥7200 RPM。
|
||||
其它
|
2U 機架式伺服器、2 冗餘電源
|
–
|
32B引數規模新建AI基礎設施場景,透過裸金屬容器承載DeepSeek的推薦配置如下:
融合節點-通用伺服器
|
3臺
|
CPU
|
x86:2*28C
|
單顆CPU≥28C 主頻≥2.2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2.2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16 x 32GB DDR4/DDR5 ECC RDIMM
|
單臺記憶體≥512G
|
||
RAID卡
|
1 x 24Gb/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式;
|
||
建議PCIE4.0及以後 x8規格卡
|
||||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
25G網絡卡
|
4 x 25Gb 連線網口,含多模光模組
|
用於網路節點複用時,需支援智慧網絡卡解除安裝GENEVE。
|
||
推薦:Mellanox ConnectX® -4/4 Lx 、5、6 EN
|
||||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
快取盤
|
4 x 960G 2.5英寸 SSD
|
DWPD≥3;
|
||
單盤≥960GB
|
||||
AL Cache Tier
|
2 x 3.2+TNVME SSD
|
DWPD≥3;
|
||
AL Cache Tier 層與資料盤層裸容量比例≥1:12;AL Cache Tier 層需配置NVME SSD。
|
||||
推薦型號:IntelP5620,更多型號參見後續會發布磁碟的相容性清單。
|
||||
資料盤
|
10 x 8TB 3.5英寸 HDD
|
1TB≤單盤≤12TB,單節點硬碟數量4-12塊,單節點資料盤總裸容量≤120T。
|
||
機械盤轉速≥7200 RPM。
|
||||
其它
|
2U 機架式伺服器、2 冗餘電源
|
–
|
||
裸金屬容器節點-GPU伺服器
|
1臺
|
CPU
|
x86:2*28C
|
單顆CPU≥28C主頻≥2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16x 32GB DDR4/DDR5 ECC RDIMM
|
單臺記憶體≥512G
|
||
RAID卡
|
1 x 12Gb/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式
|
||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
25G網絡卡
|
4 x 25Gb 連線網口,含多模光模組
|
推薦:MellanoxConnectX® -4/4 Lx 、5、6 EN
|
||
GPU
|
4*GPU(GPU數量取決於視訊記憶體配置)
|
總視訊記憶體≥128GB
|
||
x86:L20(48G)*4或RTX 6000 Ada(48G,消費級顯示卡)*4
|
||||
Arm:昇騰Atlas 300I *4
|
||||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
DeepSeek資料盤(選配)
|
(選配)伺服器本地NVME,磁碟數量按單盤規格和總容量需求,總容量≥4T。
|
這種儲存配置作為選配方案,以伺服器本地NVME儲存DeepSeek模型檔案,適用於靜態推理場景不對模型檔案進行微調或其他調整。
|
||
其它
|
2U 機架式伺服器、2 冗餘電源
|
對於70B/671B引數規模的DeepSeek,推薦使用裸金屬容器方式承載DeepSeek。此時DeepSeek算力節點推薦配置等同於上文中擴容場景中的推薦配置,在新建場景下,需要為DeepSeek算力節點提供3臺融合節點-通用伺服器的基礎設施底座,此時新建的EasyStack AI基礎設施部署形態為3臺基礎設施底座+DeepSeek算力節點,在初始部署階段即開箱實現CPU/GPU異構算力、分散式儲存、高速網路的全棧融合,可以同時支援DeepSeek智慧引擎和傳統應用。
例如671B引數規模,如採用單臺DeepSeek算力節點,則新建場景下的推薦配置如下,671B 2臺、4臺DeepSeek算力節點以及70B單臺、2臺DeepSeek算力節點的新建場景配置以此類推。
融合節點-通用伺服器
|
3臺
|
CPU
|
x86:2*28C
|
單顆CPU≥28C 主頻≥2.2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2.2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16 x 32GB DDR4/DDR5 ECC RDIMM
|
單臺記憶體≥512G
|
||
RAID卡
|
1 x 24Gb/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式;
|
||
建議PCIE4.0及以後 x8規格卡
|
||||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
25G網絡卡
|
4 x 25Gb 連線網口,含多模光模組
|
用於網路節點複用時,需支援智慧網絡卡解除安裝GENEVE。
|
||
–
|
||||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
快取盤
|
4 x 960G 2.5英寸 SSD
|
DWPD≥3;
|
||
單盤≥960GB
|
||||
AL Cache Tier
|
2 x 3.2+TNVME SSD
|
DWPD≥3;
|
||
AL Cache Tier 層與資料盤層裸容量比例≥1:12;AL Cache Tier 層需配置NVME SSD。
|
||||
推薦型號:IntelP5620,更多型號參見後續會發布磁碟的相容性清單。
|
||||
資料盤
|
10 x 8TB 3.5英寸 HDD
|
1TB≤單盤≤12TB,單節點硬碟數量4-12塊,單節點資料盤總裸容量≤120T。
|
||
機械盤轉速≥7200 RPM。
|
||||
其它
|
2U 機架式伺服器、2 冗餘電源
|
–
|
||
裸金屬容器節點-GPU伺服器
|
1臺
|
CPU
|
x86:2*50C
|
單顆CPU≥50C主頻≥2Ghz,且CPU槽位滿配
|
Arm:2*64C
|
單顆CPU≥64C 主頻≥2Ghz,且CPU槽位滿配
|
|||
記憶體
|
16x 256GB DDR4/DDR5 ECC RDIMM
|
單臺記憶體≥3072G
|
||
RAID卡
|
1 x 12Gb/s RAID 控制卡
|
支援RAIDlevels 0, 1,JBOD模式
|
||
千兆網絡卡
|
2 x 1Gb 千兆連線網口
|
支援PXE
|
||
25G網絡卡
|
4 x 25Gb 連線網口,含多模光模組
|
–
|
||
GPU
|
8*GPU(GPU數量取決於視訊記憶體配置)
|
單臺視訊記憶體≥1128GB
|
||
x86:H200(141G)*8
|
||||
Arm:不支援單節點部署671B
|
||||
系統盤
|
2 x 960G 2.5英寸 SSD
|
單盤≥960GB
|
||
DeepSeek資料盤(選配)
|
(選配)伺服器本地NVME,磁碟數量按單盤規格和總容量需求,總容量≥40T。
|
這種儲存配置作為選配方案,以伺服器本地NVME儲存DeepSeek模型檔案,適用於靜態推理場景不對模型檔案進行微調或其他調整。
|
||
其它
|
2U 機架式伺服器、2 冗餘電源
|


