提醒:更新下載,已領請忽略!
《伺服器基礎知識全解終極版(第二版)》、SSD快閃記憶體技術基礎知識全解(含PPT和PDF)近期完成更新,請購買過“伺服器基礎知識全解(終極版)”和“架構師技術全店資料打包彙總(全)(46份)”的讀者,請在微店留言獲免費取更新。由於打包資料持續增加,考慮已買讀者權益價格也即將會隨之上漲,因此,買的早就是優勢。
本次主要更新內容:
-
1、CPU更新(Intel/AMD架構演進,國產CPU架構)
-
2、GPU更新(英偉達GPU架構,從Fermi到Hopper,Rubin Ultra)
-
3、記憶體技術、操作系統、儲存技術等更新
-
4、已知問題修正
-
5、更新內容40+頁PPT
快閃記憶體技術、產品和發展趨勢全面解析(第二版)
Infiniband架構和技術實戰(第二版)
知識全解系列
(持續更新中…)
本文深入剖析阿里巴巴的晶片技術發展脈絡,對洞察國內晶片產業發展與網際網路企業技術戰略轉型意義重大。近年來,阿里巴巴憑藉自身在雲計算、大資料和人工智慧領域的深厚積累,在晶片技術研發上取得了顯著進展,逐步構建起獨特的晶片技術體系與應用生態。
一、阿里巴巴歷代晶片和技術總結
(一)玄鐵系列處理器IP
2019年,平頭哥釋出玄鐵910,這是一款基於RISC-V開源指令集的處理器IP ,採用12nm製程工藝 ,在效能上達到國際領先水平。玄鐵910的誕生,不僅降低了晶片設計門檻,還為國內眾多晶片設計企業提供了更多自主選擇,助力物聯網(IoT)終端晶片發展。它可廣泛應用於微控制器、工業控制、智慧家電、智慧電網、影像處理、人工智慧、多媒體和汽車電子等領域 。

隨後,平頭哥又宣佈開源玄鐵RISC-V系列處理器(玄鐵E902、E906、C906、C910) ,進一步豐富了玄鐵家族,透過開放相關工具及系統軟體,拉近了RISC-V技術與開發者的距離,推動了RISC-V生態建設。
(二)含光800 AI推理晶片
2019年雲棲大會上,阿里巴巴釋出第一顆AI晶片含光800 。在業界標準的ResNet-50測試中,含光800推理效能達到78563 IPS(每秒處理78563張照片),比此前業界最好的AI晶片效能高4倍;能效比500 IPS/W,是第二名的3.3倍 。在杭州城市大腦的業務測試中,1顆含光800的算力相當於10顆GPU 。

其效能突破得益於軟硬體協同創新:硬體層面採用自研晶片架構,利用推理加速等技術有效解決晶片效能瓶頸;軟體層面整合達摩院先進演算法,針對CNN及視覺類演算法深度最佳化計算、儲存密度,實現大網路模型在一顆NPU上完成計算。
含光800主要應用於視覺場景,已在阿里巴巴內部核心業務如城市大腦、拍立淘商品庫圖片識別等場景中使用 ,並透過阿里雲對外輸出AI算力,基於含光800的AI雲服務上線,相比傳統GPU算力,價效比提升100%。
(三)倚天710通用伺服器晶片
2021年,阿里巴巴推出倚天710,這是第一顆採用5nm工藝的伺服器晶片,基於最新的Armv9架構 。它集成了超過600億個晶體,內含128核CPU,主頻最高達到3.2GHz,能同時兼顧效能和功耗 。在記憶體和介面方面,整合業界領先的DDR5、PCIE5.0等技術,有效提升晶片傳輸速率,可適配雲的不同應用場景。

在SPECInt2017基礎測試平臺上,倚天710跑分達到440分 ,效能超過業界標杆20%,能效比優於業界標杆50% ,能幫助資料中心節能減排 。倚天710是阿里雲推進“一雲多芯”策略的重要一步,主要用於阿里雲資料中心部署,不出售,滿足了阿里雲對高效能、低功耗伺服器晶片的需求,降低阿里巴巴集團內部整體計算成本 。
(四)新型存算一體架構晶片
阿里巴巴達摩院研發的新型存算一體架構晶片,是全球首款基於DRAM的3D鍵合堆疊存算一體AI晶片 。它可突破馮·諾依曼架構效能瓶頸,滿足人工智慧等場景對高頻寬、高容量記憶體和極致算力的需求 。在特定AI場景中,該晶片效能提升10倍以上,能效比提升高達300倍 。晶片採用混合鍵合(Hybrid Bonding)的3D堆疊技術 ,將計算晶片和儲存晶片face-to-face地用特定金屬材質和工藝進行互聯 ,增加頻寬,降低資料搬運代價 。記憶體單元採用異質整合嵌入式DRAM,片上記憶體頻寬可高達37.5GB/s/mm2 ,計算晶片採用流式的定製化加速器架構,對推薦系統進行“端到端”加速 ,在阿里自身推薦系統任務測試中展現出先進性 ,未來在VR/AR、無人駕駛、天文資料計算、遙感影像資料分析等場景有廣闊應用前景 。
二、技術亮點剖析
(一)軟硬體協同最佳化
以含光800為代表,硬體架構與軟體演算法深度協同。硬體透過獨特架構設計與推理加速技術,為軟體演算法執行提供高效硬體平臺;軟體演算法針對硬體特性深度最佳化計算與儲存密度,充分發揮硬體效能,解決傳統晶片中硬體與軟體適配不佳導致的效能瓶頸問題,極大提升晶片在AI推理任務中的效能與能效。
(二)先進製程與架構應用
倚天710採用5nm先進製程工藝,容納超600億個電晶體,實現高度整合 。基於Armv9架構 ,並對其深度定製,在前端架構設計上最佳化片上互聯,採用新流控演算法解決核數眾多時的頻寬瓶頸,提升系統效率與擴充套件性 ;後端物理實現中靈活排程30種不同EDA軟體 ,定製時鐘網路和IP技術 ,確保晶片效能與功耗最佳化,使倚天710在效能和能效比上超越業界標杆。
(三)存算一體創新架構
新型存算一體晶片打破傳統馮·諾依曼架構計算與儲存分離模式 ,將計算單元和儲存單元融合 。採用3D鍵合堆疊技術和近存計算路線 ,大幅減少資料搬運 ,提升計算並行度和能效 ,有效解決記憶體牆、功耗牆和效能牆問題 ,為人工智慧等對算力和記憶體頻寬要求苛刻的場景提供全新解決方案 。
三、技術線路圖分析
(一)短期規劃
持續最佳化現有晶片效能,如提升倚天710在不同雲應用場景下的穩定性和相容性,進一步挖掘含光800在新興視覺AI領域的應用潛力 。加強與生態夥伴合作,基於玄鐵系列處理器IP,推動更多物聯網終端裝置晶片設計與量產,豐富RISC-V生態軟體和硬體適配。
(二)中期規劃
計劃推出下一代AI推理晶片和伺服器晶片,採用更先進製程工藝(如3nm) ,在效能上實現質的飛躍 。針對邊緣計算場景,研發專用晶片,滿足5G時代邊緣裝置對低功耗、高效能計算的需求 。深化存算一體晶片技術研究,拓展其在更多複雜AI場景的應用。
(三)長期規劃
致力於成為全球領先的晶片研發企業,持續探索前沿晶片技術,如量子 – 晶片融合技術、類腦晶片技術等 。拓展國際市場,將自研晶片技術和產品推向全球,參與國際晶片市場競爭,提升中國晶片產業國際影響力。
四、核心技術解析
(一)自主晶片架構設計
無論是含光800的AI晶片架構,還是倚天710基於Armv9架構的深度定製,阿里巴巴都展現出強大的自主架構設計能力 。透過自主設計架構 ,可根據自身業務需求和技術發展趨勢,對晶片的運算單元、儲存結構、資料通路等進行最佳化,實現效能、功耗和成本的最佳平衡 ,擺脫對國外晶片架構的依賴。
(二)RISC-V生態構建
玄鐵系列處理器基於RISC-V開源指令集 ,阿里巴巴透過開源處理器、開放工具及系統軟體 ,積極推動RISC-V生態建設 。吸引大量開發者和企業參與,形成從處理器IP、晶片設計、軟體開發到終端應用的完整生態鏈,為國內晶片產業在開源指令集領域佔據一席之地 ,降低晶片研發門檻和成本。
(三)3D堆疊與先進封裝技術
新型存算一體晶片採用的3D鍵合堆疊技術,以及倚天710在後端物理實現中可能涉及的先進封裝技術 ,是阿里巴巴晶片技術的關鍵支撐 。3D堆疊技術實現晶片間高密度互聯 ,提高資料傳輸速率 ,增加晶片整合度;先進封裝技術可提升晶片散熱能力、電氣效能和可靠性 ,滿足高效能晶片對封裝的嚴格要求。
五、最新產品應用與實踐
(一)雲計算與資料中心
倚天710在阿里雲資料中心大規模部署 ,為阿里雲的彈性計算、資料庫、大資料分析等服務提供強大算力支援 。在處理大規模資料計算任務時,倚天710憑藉高效能和高能效比,有效降低資料中心能耗和運營成本 ,提升服務響應速。例如,在電商大促期間,可快速處理海量使用者訪問和交易資料,保障阿里雲服務穩定執行。
(二)人工智慧與機器學習
含光800在阿里巴巴內部人工智慧業務中廣泛應用,如搜尋推薦、影像識別、影片直播等領域。在搜尋推薦系統中,含光800加速機器學習模型推理過程,快速為使用者推薦精準商品和內容 ;在影像識別場景 ,如商品圖片稽核、人臉識別等 ,能高效完成影像特徵提取和分類任務 ,提升業務效率和準確性。
(三)物聯網與邊緣計算
基於玄鐵系列處理器IP設計的物聯網終端晶片,應用於智慧家居、工業控制、智慧穿戴等裝置 。在智慧家居中 ,實現家電裝置智慧化控制與互聯互通 ;在工業控制領域 ,用於感測器資料採集與處理、裝置狀態監測等 ,提升工業生產自動化和智慧化水平 ;在智慧穿戴裝置中 ,滿足低功耗、小型化的計算需求,實現健康監測、運動追蹤等功能。
六、結論
阿里巴巴在晶片技術領域從無到有、從弱到強 ,透過一系列創新晶片產品和技術突破,在雲計算、人工智慧、物聯網等領域發揮重要作用 。其技術亮點突出,技術線路圖規劃清晰 ,核心技術不斷突破 ,產品應用逐步拓展 。然而 ,阿里巴巴也面臨國際晶片巨頭競爭、晶片技術迭代快速等挑戰。未來需持續加大研發投入 ,加強技術創新和生態建設 ,提升晶片效能和競爭力 ,為我國晶片產業發展注入強大動力 ,推動國產晶片走向世界舞臺。
相關閱讀:
-
海思昇騰920晶片解析:達芬奇架構進化與AI算力躍遷 -
智算中心網路常見組網拓撲分析 -
中國智算中心:佈局、分佈與發展態勢 -
SSD快閃記憶體技術基礎知識全解(終極版) -
昇騰310晶片引數及技術概述 -
InfiniBand,撼動不了乙太網? -
InfiniBand高效能網路設計概述 -
面向E級計算的4款高效能處理器概述 -
基於鯤鵬處理器的高效能計算實踐 -
高效能計算關鍵元件核心知識 -
一文全解高效能製造模擬技術 -
高效能計算:RoCE技術分析及應用 -
高效能計算:談談被忽視的國之重器 -
高效能計算:RoCE v2 vs. InfiniBand網路該怎麼選? -
高效能網路全面向RDMA進軍



免責申明:本號聚焦相關技術分享,內容觀點不代表本號立場,可追溯內容均註明來源,釋出文章若存在版權等問題,請留言聯絡刪除,謝謝。
推薦閱讀
更多架構相關技術知識總結請參考“架構師全店鋪技術資料打包(全)”相關電子書(46本技術資料打包彙總詳情可透過“閱讀原文”獲取)。
溫馨提示:
掃描二維碼關注公眾號,點選閱讀原文連結獲取“架構師技術全店資料打包彙總(全)”電子書資料詳情。

