九大國產AI算力晶片全景圖

AI 算力晶片主要包括 GPU、FPGA,以及以 VPU、TPU 為代表的 ASIC 晶片。其中以 GPU 用量最大,據 IDC 資料,預計到 2025 年 GPU 仍將佔據 AI 晶片 8 成市場份額。然而,相較傳統圖形 GPU,通用型算力 GPU 在晶片架構上縮減了圖形影像顯示、渲染等功能實現,具有更優的計算能效比,因而被廣泛應用於人工智慧模型訓練、推理領域。

參考連結:
1、中國電信業人工智慧行業應用發展圖譜(2024)
2、中國汽車業人工智慧行業應用發展圖譜(2024)
AI 晶片可以分為雲端 AI 晶片 、邊緣和終端 AI 晶片;根據其在實踐中的目標,可分為訓練( training )晶片和推理( inference )芯片。雲端主要部署高算力的 AI 訓練晶片和推理晶片,承擔訓練和推理任務,具體有智慧資料分析、模型訓練任務和部分對傳輸頻寬要求比高的推理任務;邊緣和終端主要部署推理晶片,承擔推理任務,需要獨立完成資料收集、環境感知、人機互動及部分推理決策控制任務。
1、效能與生態:AI算力晶片壁壘
評價 AI 晶片的指標主要包括算力、功耗、面積、精度、可擴充套件性等,其中算力、功耗、面積(PPA)是評價 AI 晶片效能的核心指標:
(1)算力:衡量 AI 晶片算力大小的常用單位為 TOPS 或者 TFLOS,兩者分別代表晶片每秒能進行多少萬億次定點運算和浮點運算,運算資料的型別通常有整型 8 位元(INT8)、單精度 32 位元(FP32)等。AI 晶片的算力越高,代表它的運算速度越快、效能越強。
(2)功耗:功耗即晶片執行所需的功率,除了功耗本身,效能功耗比是綜合衡量晶片算力和功耗的關鍵指標,它代表每瓦功耗對應輸出算力的大小。
(3)面積:晶片的面積是成本的決定性因素之一,通常來講相同工藝製程之下,芯片面積越小良率越高,則晶片成本越低。此外,單位芯片面積能提供的算力大小亦是衡量 AI 晶片成本的關鍵指標之一。
英偉達的 GPGPU 是全球應用最為廣泛的 AI 晶片,決定其效能的硬體引數主要包括:微架構、製程、CUDA 核數、Tensor 核數、頻率、視訊記憶體容量、視訊記憶體頻寬等。其中,微架構即 GPU 的硬體電路設計構造的方式,不同的微架構決定了 GPU的不同效能,作為英偉達 GPU 的典型代表,V100、A100、H100 GPU 分別採用Volta、Ampere、Hopper 架構;CUDA 核是 GPU 內部主要的計算單元;Tensor核是進行張量核加速、卷積和遞迴神經網路加速的計算單元;視訊記憶體容量和頻寬是決定 GPU 與儲存器資料互動速度的重要指標。
2、國產AI 算力晶片全景圖
全球 AI 晶片市場被英偉達壟斷,然而國產 AI 算力晶片正起星星之火。目前,國內已湧現出瞭如寒武紀、海光資訊等優質的 AI 算力晶片上市公司,非上市 AI 算力晶片公司如沐曦、天數智芯、壁仞科技等亦在產品端有持續突破。
1、寒武紀
寒武紀 AI 晶片思元 290 面向雲端訓練,思元 370 面向雲端訓推一體,兩款晶片均採用 7nm 製程工藝。此外,思元 370 是寒武紀首款採用 chiplet 技術的 AI 晶片,最大算力高達 256TOPS;訓練側新品思元 590 在研發中。
寒武紀雲端產品已打入阿里雲等頭部網際網路客戶,並與頭部銀行等金融領域客戶進行了深度技術交流,同時亦得到了頭部伺服器廠商的認可。展望2023 年,隨著 ChatGPT 為代表的 AI 大模型不斷湧現,AI 算力需求有望加速增長,從而驅動 AI 算力晶片需求增長。寒武紀作為國內領先的 AI 晶片公司,產品研發、市場拓展、客戶匯入均有較強先發優勢,有望深度受益 AI 發展的浪潮與 AI 算力晶片國產化趨勢,在 23 年取得快速成長。
2、海光資訊
海光資訊擁有成功研發 x86 處理器或 ARM 處理器的經驗。海光資訊的 DCU 晶片深算一號採用 7nm 工藝,相容“類 CUDA”環境,軟硬體生態豐富,已於 2021年實現規模化出貨,未來將廣泛應用於大資料處理、人工智慧、商業計算等領域。
3、沐曦積體電路
沐曦積體電路首款異構 GPU 產品 MXN100 採用 7nm 製程,已於 2022 年 8 月回片點亮,主要應用於推理側;應用於 AI 訓練及通用計算的產品 MXC500 已於 2022 年 12 月交付流片,公司計劃 2024 年全面量產。
4、天數智芯
天數智芯的 Big Island 雲端 GPGPU 是一款具有自主智慧財產權、自研 IP 架構的 7nm 通用雲端訓練晶片,這款晶片達到 295TOPSINT8 算力。
5、壁仞科技
壁仞科技釋出首款 GPGPU 晶片BR100,BR100 晶片採用 chiplet 技術,其 16 位浮點算力達到 1000T 以上、8 位定點算力達到 2000T 以上。
6、燧原科技
公司最新發布的第二代推理產品雲燧 i20 是面向資料中心應用的第二代人工智慧推理加速卡,採用 12nm 工藝,透過架構升級大大提高了單位面積的電晶體效率,算力可媲美 7nm GPU,達到 256TOPS。
7、崑崙芯
崑崙芯新品 AI 晶片 R200 於 2022智算峰會上正式釋出,基於新一代崑崙芯自研架構 XPU-R,通用性和效能顯著提升,採用 先進工藝。配合百度飛槳平臺,獲得更友好開發的環境。
8、平頭哥
平頭哥有兩條研發主線,一是利用 ARM 的 IP 為阿里雲資料中心研發晶片,在雲端提供普惠算力,即倚天系列和含光系列;另一邊集中在 RISC-V 處理器架構的研發,如玄鐵系列,主要應用是在 AIoT 領域。公司技術團隊由原中天微、高通、AMD、華為海思等擁有豐富研發經驗的人員構成。平頭哥於 2019 年 9 月釋出首顆資料中心晶片含光 800,採用 12nm 工藝,效能峰值算力達 820 TOPS。
9、昇騰計算產業鏈
華為主打 AI 晶片產品有310 910B310 偏推理,當前主打產品為 910B,擁有FP32 和 FP16 兩種精度算力,可以滿足大模型訓練需求。910B 單卡和單臺伺服器效能對標 A800/A100
騰計算產業是基於騰 AI 晶片和基礎軟體構建的全棧 AI 計算基礎設施、行業應用及服務,能為客戶提供 AI 全家桶服務。主要包括騰 AI 晶片、系列硬體、CANNAI 計算框架、應用使能、開發工具鏈、管理運維工具、行業應用及服務等全產業鏈。
根據電子發燒友統計,在國產 AI 算力晶片中,寒武紀推出的雲端訓練側產品思元 290達到 512TOPS INT8 算力,訓推一體產品思元 370 達到 256TOPS INT8 算力;海光資訊 DCU 產品深算一號部分引數對標英偉達 A100。
國內非上市公司中,天數智芯的訓練側產品 BI 達到 295TOPS INT8 算力;沐曦的推理側產品MXN100 已於 2022 年 8 月回片點亮。網際網路巨頭亦強勢入局 AI 晶片,騰訊領投的燧原科技推出推理側產品雲燧 i20,INT8 算力達 256TOPS;百度孵化的崑崙芯推出訓推一體 AI 晶片 R200,INT8 算力達 256TOPS;背靠阿里的平頭哥亦早在 2019 年就推出推理側 AI 晶片含光 800。
相關閱讀:


免責申明:本號聚焦相關技術分享,內容觀點不代表本號立場,可追溯內容均註明來源,釋出文章若存在版權等問題,請留言聯絡刪除,謝謝。
推薦閱讀
更多架構相關技術知識總結請參考“架構師全店鋪技術資料打包(全)”相關電子書(44本技術資料打包彙總詳情可透過“閱讀原文”獲取)。
全店內容持續更新,現下單“架構師技術全店資料打包彙總(全)”一起傳送“伺服器基礎知識全解(終極版)和“儲存系統基礎知識全解(終極版)pdf及ppt版本,後續可享全店內容更新“免費”贈閱,價格僅收259元(原總價399元)。
溫馨提示:
掃描二維碼關注公眾號,點選閱讀原文連結獲取架構師技術全店資料打包彙總(全)電子書資料詳情



相關文章