
2025 年 7 月 1 日,宣城市城市運營發展集團有限公司釋出《通用 AI 算力裝置》招標公告,預算 10570.42 萬元。
貨物需求:


採用國產自主品牌加速卡,可廣泛應用於通用計算、新演算法研究等場景,具備自研通用 GPGPU 架構和指令集,具有完全自主智慧財產權,架構提供強大的多精度混合算力提供 150P@FP16/BF16 半精度算力、叢集規模不少於 440 張卡的人工智慧算力叢集,同步建設具有高頻寬、低延遲的無損智算網路及具備納管、排程算力、儲存及通用算力的雲管平臺。
GPU 卡技術性能要求:
加速卡採用通用 GPU 架構,7 納米制程及 2.5D CoWoS 封裝技術,容納 240 億電晶體,晶片支援 FP32、FP16、BF16、INT8、INT16、 INT32 等多精度型別,支援高速片間互聯,可達到 175 TFLOPS@FP16 的超強算力,整合 32GB HBM2E 記憶體晶片與主機之間由高速的 PCle Gen4 x16lane 完成,每條 lane 可達到 32Gb/s 的速度,晶片與主機間可提供 64GB/s 的資料吞吐率。
適配主流 CPU 晶片/伺服器廠商,能夠支援國內外主流軟硬體生態和各種深度學習框架、演算法模型和加速庫,透過標準化的軟硬體生態介面為行業解決產品使用難、開發平臺遷移成本大等痛點,應用遷移成本低、耗時短、無需重新開發,可大幅縮短適配驗證週期,使客戶業務系統幾乎無感知地使用。
針對通用計算和深度學習應用的開發和部署可提供了一套完善而高效的軟體 棧工具,支援 x86 和 ARM 等架構。整合多種主流的深度學習程式設計框架, 並且提供基於 C/C++的程式設計介面拓展和高效能函式庫,賦予模型訓練及推理更優異的效能表現,提供一系列除錯和調優工具,可滿足不同層次的應用開發及除錯需求,為高效能計算和人工智慧應用的開發和部署提供了便利。
開發者可簡單高效地實現深度學習以及各類資料科學應用的開發和除錯。 軟體棧支援主流深度學習程式設計框架及主流運算元及網路模型,開發者可基於加速卡開發更加簡潔且通用的應用。相應軟體棧支援資料併發任務,適用於並行運算場景,提供高效能函式庫,帶來更高的程式執行效率。
供應商需結合自身對技術引數及要求專案理解,對技術方案配置進行補充和完善,包括但不限於高頻寬低時延無損智算網路效能、雲計算平臺系統等相關軟體。方案涵蓋了實現 150P 算力服務所需的所有軟硬體產品及服務。
中標結果
2025 年 7 月 22 日釋出中標結果,北京九洲科瑞科技有限公司 105249250.00 元(中)。



