

下載提醒:伺服器基礎知識全解終極版(第二版),儲存系統基礎知識全解(終極版),SSD快閃記憶體技術基礎知識全解(含PPT和PDF)近期完成更新(已領請忽略),請購買過“架構師技術全店資料打包彙總(全)(46份)”的讀者,請在微店留言獲免費取更新。
本文來自“中國科學院超級計算中心創新發展”,“高效能計算技術、方案和行業全解(第二版)”,超級計算是衡量國家科技實力的重要指標,是繼理論分析和實驗觀測之後現代科學的第三支柱,在國家基礎與前沿科學研究、經濟社會發展建設、國防安全等方面具有不可或缺的戰略價值。
1 國內外超級計算發展概述
1.1 國外超級計算發展現狀
超級計算能力是國家綜合科技實力的核心要素,不僅為重大科學工程提供算力保障,更在驅動國家科學研究、經濟高質量發展和維護國家戰略安全層面展現出獨特價值。全球科技強國均將超級計算納入戰略發展方向,持續的提供政策與資金投入以保持其領先性。
美國高度重視超級計算技術發展,依託美國能源部(DOE)、國家科學基金會(NSF)和國家航空航天局(NASA)構建的三大超級計算體系,多年來透過實施“戰略計算機計劃”(SCP)、“高效能計算和通訊計劃”(HPCC)、“加速戰略計算”(ASCI)、“先進模擬和計算”(PACI)、“高生產率計算機”(HPCS)等多項國家計劃,帶動了美國諸多行業的突破性創新]。
2022年5月美國橡樹嶺國家實驗室(ORNL)研製的超級計算機 Frontier獲得 TOP500 榜首。2024 年 11 月勞倫斯利弗摩爾國家實驗室在“Sierra”的基礎上部署的 E級機“El Capitan”摘得TOP500超算榜單第1名。
日本綜合自然科學研究所理研 RIKEN加入到中美超算競爭,對超算系統投入了相當多的人力和資金。投資 72.7 億元打造的“富嶽”繼“京”超算系統後時隔 9年於 2020年 5月獲得 TOP500榜首,率先邁出了E級超算系統第一步。該機構初步規劃下一代超級計算機“富嶽 NEXT”將在2030年投入運營,其有效效能提升將至“富嶽”的5 至 10 倍,計算能力突破 3EFLOPS、AI 效能超50EFLOPS,遠超當前最強系統“El Capitan”。該系統的研製體現了日本在高效能計算和人工智慧領域的深耕,以及綠色節能理念的堅持。
歐洲也一直是高效能計算的活躍區域,歐洲分散式超級計算應用基礎設施聯盟(DEISA)和歐洲高階計算合作計劃(PRACE)等專案推動了歐盟的超級計算發展[3]。2018 年歐盟成員國共同投資 10億歐元成立歐洲高效能計算共同計劃(EuroHPC JU),計劃在 2019-2026 年間投資 8.4億歐元,建設8臺世界級超級計算機。2020年歐盟對該計劃加大投資至80億歐元[4],進行百億億次超級計算機以及量子計算機的研製工作,維持歐洲在超級計算以及量子計算領域的主導地位。

隨著各國的國家超算戰略計劃逐步推行落地,全球迎來了一次大規模超算系統更替潮,系統性能步入E級時代的同時,系統體系架構的多樣化、大資料與人工智慧融合應用需求的迅速增長,使超算創新應用的開發成為業界關注的焦點。2024 年 11 月 ISC 2024 大會公佈了 TOP500超算榜單,下表是Top500前10名。
1.2 國內超級計算發展現狀
“九五”以來我國積聚發展起來一批超級計算機研發的中堅力量。國家平行計算機工程技術研究中心、中國科學院計算技術研究所國家智慧中心、國防科技大學計算機學院、曙光公司等在高效能計算機研製方面長足發展,研製出了計算效能世界領先的超計算系統。
2008年聯想公司和曙光公司分別研製成功“深騰 7000”和“曙光 5000”百萬億次計算機。2009 年,國防科技大學研製成功“天河一號”千萬億次計算機,使我國成為全球第二個掌握千萬億次計算能力的國家。2010年6月,曙光公司研製成功“星雲”千萬億次計算機,效能列世界 TOP500 第二位。同年 11 月,“天河-1A”系統首次登頂全球超算榜首,隨後“天河二號”連續四次蟬聯 TOP500 第一名,展現了我國在超算領域的持續突破。在自主 CPU 晶片研製方面我國也取得重大突破,2016年採用40,960箇中國自主研發的“申威 26010”眾核處理器的“神威·太湖之光”超級計算機研製成功,安裝在國家超級計算無錫中心。該系統在 2016 年 6 月的國際超算大會上首次問鼎 TOP500 榜首,並連續四次保持全球第一的領先地位。
2019 年 6 月美國商務部將我國三家 E級超算研製單位列入實體清單,試圖限制我國超算技術的發展。在此背景下,國產多核處理器“龍芯”、“神威”、“飛騰”、“海光”等系列的研發取得顯著進展,而且圍繞這些國產處理器的軟體生態建設也在穩步推進,包括作業系統適配、編譯器最佳化以及領域專用庫的開發等工作,為構建自主可控的超算技術體系奠定了重要基礎。
我國的大型超級計算機的建設和執行以科技部支援的國家超算中心為依託單位,自“十一五”計劃開始至今,全國共批覆建設完成天津、廣州、長沙、深圳、濟南、無錫、鄭州、崑山、成都和西安等 14 家國家超級計算中心[7],服務於氣象、能源、生物醫藥、人工智慧等關鍵領域。

除了超算中心,人工智慧計算中心的佈局同樣充滿看點。目前國內已經建成並運營的城市有7座,其中深圳的計算能力達到1,000PFLOPS,武漢為 200PFLOPS,西安和成都各為 300PFLOPS,許昌、南京和杭州也分別擁有 40 至 100PFLOPS不等的算力[8]。隨著東數西算的國家戰略深入推進,未來西部地區將逐步成為人工智慧算力新興佈局的重要區域。
2 中國科學院超級計算中心發展
2.1 引進七代超算系統
(1)第一代(1996 年):SGI Power ChallengeXL
1996年6月,計算機網路資訊中心超級計算應用室引進美國 SGI 公司的共享儲存平行計算機 SGI Power Challenge XL,是當時中端市場中最暢銷的 HPC 伺服器。系統基於美國 Silicon Graphics(SGI)公司的 Power Challenge XL 系統,採用 MIPS RISC 處理器和對稱多處理(SMP)架構,包括 16個 MIPS R10000處理器,峰值浮點效能每秒 64億次,適用於氣象模擬、流體力學等科學計算任務。作為中國早期引進的高效能計算系統,為國內超算研究提供了重要的技術參考,推動了平行計算軟體的開發。
(2)第二代(1998年):Hitachi SR2201
1998 年,中國科學院引入了 Hitachi SR2201超級計算機,該系統由日本日立(Hitachi)公司研製,屬於當時國際先進的大規模並行處理(MPP)系統。SR2201的部署標誌著中國超算從早期的SMP架構向更高可擴充套件性的平行計算體系邁進,為國內科研機構提供了更強的計算能力支撐。
系統採用日立自主研發的PA-RISC架構處理器,主頻約150 MHz,支援超標量流水線技術。系統峰值浮點效能每秒 96億次,具有高可擴充套件性、低通訊開銷等特點。
(3)第三代(2000 年):曙光 2000,Dawning-2000
2000 年,中國自主研發的曙光 2000(Dawning-2000)超級計算機正式投入使用,標誌著中國超算開始擺脫對國外技術的依賴,進入自主創新的快速發展階段。該系統由中國科學院計算技術研究所與曙光公司聯合研製,強調高速資料交換能力,適用於大規模科學計算。峰值效能達到111.7 GFlops(千億次浮點運算/秒),成為當時國內最先進的高效能計算平臺之一。曙光系列的崛起,代表中國開始自主研發超算系統,減少對國外技術的依賴。曙光 2000是中國首臺突破百億次計算的自主超算,為後續曙光系列(如曙光4000、曙光5000)奠定基礎。
(4)第四代(2003 年):深騰 6800 超級計算機 ,Lenovo DeepComp6800
2003 年,由國家 863 專案和中國科學院“十五”資訊化專項共同支援、聯想公司自主研發的深騰 6800(DeepComp 6800)超級計算機成功面世,峰值效能達到 5.3 TFlops(萬億次浮點運算/秒)。該系統在2003年全球TOP500超級計算機排行榜中位列第 14 名,標誌著中國超算首次進入世界前列,並展現了國產超算在商業化與高效能計算結合方面的突破。

(5)第五代(2008 年):深騰 7000 超級計算機 ,Lenovo DeepComp7000

2008 年 ,聯 想 集 團 推 出 深 騰 7000(Deep Comp 7000)超級計算機,峰值效能達到 102.8TFlops,成為我國首臺突破百萬億次計算的超級計算機。“深騰 7000”是聯想集團、北京航空航天大學、中國科學院計算機網路資訊中心聯合攻關,國家 863計劃的重大科技成果。系統採用混合叢集架構,結合傳統 CPU 計算與 GPU 加速。
CPU 為 Intel Xeon E54xx 系列四核處理器,主頻2.33-3.0 GHz,部分節點配備NVIDIA Tesla GPU,實現CPU-GPU異構計算,峰值效能102.8 TFlops。深騰 7000是當時世界上規模最大的節點無盤啟動機群系統,也是世界上率先實現對所有硬體部件統一管理和監控功能的機群系統,是國內第一個實際效能突破每秒百萬億次的異構機群系統,在 2008 年 11 月全球 TOP500 排行榜中位列第 19名,標誌著中國超算正式邁入“千萬億次時代”。
(6)第六代(2014 年):“元”超級計算機,Era Supercomputer
2014年3月,安裝執行在計算機網路資訊中心懷柔園區的超級計算機系統“元”啟動建設,並分三期建設完成。2014年6月,一期系統完成裝置安裝,2014 年 11 月上線服務;2015 年 12 月,“元”二期系統完成裝置安裝,2016年8月上線服務;2017年12月,“元”三期“人工智慧叢集”完成裝置安裝,建成人工智慧平臺並提供試執行服務,2018年10月正式對使用者開放服務。
系統採用混合架構,支援異構計算,雙精度浮點峰值計算能力約 2.69Pflops,其中 CPU 通用計算能力 750.07 Tflops,採用 Intel MIC 及 Nvidia GPU 的計算能力共1.94Pflops。系統記憶體總量約152TB,儲存總裸容量超過6.9PB。
(7)第七代(2019 年):“東方”超級計算機,ORISE Supercomputer
2019年,中國科學院發揮建制化優勢研製了新一代計算機“東方”超級計算系統,面向E級計算重大需求,為中國科學院資訊化建設和科研能力提升提供重大支撐。系統採用面向多領域的超融合體系結構,融合了層次化分散式並行儲存系統、高效全浸沒式相變冷卻、超融合資源和排程等最新成果,計算效能卓越。配置基於 x86架構 的 國 產 通 用 處 理 器 和 加 速 卡 ,曙 光 Parastor300S並行儲存系統,100PB大容量資料儲存,全線速、無阻塞的 200Gb HDR Infiniband 專用計算網路,以及完整、高效、專業的基礎軟體,包括作業系統、並行編譯開發環境等,支援 CPU 和加速卡的多種編譯環境及應用,主要包括編譯器、偵錯程式、MPI並行開發環境及數學庫等。
2.2 研發演算法與軟體
科學計算涉及眾多應用領域。中國科學院超級計算中心以實際應用需求為牽引,從基礎軟體研究入手,持續設計高效基礎演算法,自主研發並行框架軟體。
2.2.1 自主研發基礎軟體
(1)並行演算法軟體包HPSEPS
在科學與工程領域,大規模特徵值問題是計算核心,廣泛應用於結構動力學分析、量子化學、電子結構和材料科學等多方面。為解決相關計算難題,中心自主研發了目前國際上唯一提供稠密和稀疏特徵問題等多個並行求解器的並行演算法軟體包HPSEPS(High Performance Symmetric Ei genproblem Solvers)。


(2)多預條件稀疏線性代數計算框架HPLES
在科研與工程領域,稀疏線性代數問題的高效求解至關重要。為滿足複雜數值計算需求,提升計算效率與精度,中心科研團隊自主研製了多預條件稀疏線性代數計算框架HPLES(High Performance Linear Equition Solver)。
HPLES 已在船舶流體模擬、多物理量精確求解、超大規模“多相多組分滲流全隱式模擬”精確求解等多個領域應用,為相關科研工作提供了可靠的計算支援,取得了良好的計算效果。
作者:錢芳,柴芳姣,趙芸卿,田原,白一頔,姜金榮
相關閱讀:
-
海思昇騰920晶片解析:達芬奇架構進化與AI算力躍遷 -
昇騰910 AI晶片技術全面概述 -
乾貨收藏:GPU引數詳解與主流產品對比分析 -
寒武紀AI晶片分析報告 -
智算中心網路常見組網拓撲分析 -
中國智算中心:佈局、分佈與發展態勢 -
SSD快閃記憶體技術基礎知識全解(終極版) -
昇騰310晶片引數及技術概述 -
InfiniBand,撼動不了乙太網? -
InfiniBand高效能網路設計概述 -
面向E級計算的4款高效能處理器概述 -
基於鯤鵬處理器的高效能計算實踐 -
高效能計算關鍵元件核心知識 -
一文全解高效能製造模擬技術 -
高效能計算:RoCE技術分析及應用 -
高效能計算:談談被忽視的國之重器 -
高效能計算:RoCE v2 vs. InfiniBand網路該怎麼選? -
高效能網路全面向RDMA進軍



免責申明:本號聚焦相關技術分享,內容觀點不代表本號立場,可追溯內容均註明來源,釋出文章若存在版權等問題,請留言聯絡刪除,謝謝。
推薦閱讀
更多架構相關技術知識總結請參考“架構師全店鋪技術資料打包(全)”相關電子書(46本技術資料打包彙總詳情可透過“閱讀原文”獲取)。
溫馨提示:
掃描二維碼關注公眾號,點選閱讀原文連結獲取“架構師技術全店資料打包彙總(全)”電子書資料詳情。

