導語
在人工智慧推理日益走向邊緣計算的浪潮中,Imagination推出全新E系列(E-Series)GPU IP,以革命性的“AI+圖形”深度融合架構,回應邊緣側對低功耗、高靈活性與強算力的多重需求。透過架構創新、算力擴充套件、功耗最佳化以及軟體生態配套,E系列試圖重新定義“邊緣AI計算”的邊界,並提供一條兼顧靈活性與高效性的技術路徑。
邊緣AI進入加速期,GPU迎來轉型視窗
當前邊緣側AI推理正以前所未有的速度增長。從市場應用端來看,自動駕駛、智慧手機、工廠裝置、甚至消費級機器人,都在逐步脫離雲端,開始在本地完成影像識別、路徑規劃、語音互動等智慧化任務。
Imagination中國區技術總監艾克指出,邊緣AI需求的爆發源於多重因素:一是隱私敏感資料(如健康資料或企業資料)無法上雲;二是即時性要求(如輔助駕駛的瞬時響應);三是邊緣裝置的資源限制(如功耗和算力)。據統計,Hugging Face上AI模型下載量從2023年的70萬激增至2025年的700萬,反映了邊緣側模型部署的幾何級增長。同時,AI演算法從卷積神經網路(CNN)到Transformer,再到圖生影片等複雜多模態模型的快速迭代,對硬體的靈活性和平行計算能力提出了更高要求。

圖源:Imagination(下同)
傳統處理器架構在應對邊緣AI時各有優劣:CPU靈活,但處理並行任務吃力;NPU強大,卻在應對新模型、新運算元時捉襟見肘;GPU,特別是可程式設計的通用GPU,恰好介於兩者之間。但傳統GPU並非為AI推理而生,其架構仍有諸多最佳化空間。在當前AI工作負載逐年變化的情況下,AI硬體系統仍需要一定程度的靈活性和通用加速能力,以確保裝置的未來適用性。而Imagination的E系列GPU IP正是在這個夾縫中開闢了一條新路。

E系列:GPU設計的正規化轉變
架構革新:圖形與AI的深度融合
E系列GPU是Imagination產品線的一次重大飛躍,其最大的亮點,在於其對“AI+圖形”融合的系統性重構。
據Imagination中國區技術總監艾克的介紹,Imagination多年來在圖形處理上積累的大量技術,例如分塊延遲渲染技術(TBDR)、壓縮緩衝等技術,天然具備低功耗、高利用率的特點。當這些架構被用來服務AI推理時,展現出強大的效能密度優勢。E-Series 將AI加速能力“原生”嵌入GPU體系,讓GPU從圖形引擎演進為通用AI處理核心。
眾所周知,Imagination的PowerVR GPU架構以能效著稱,已在功耗受限裝置中應用近二十年。然而,在硬體功耗與面積控制方面,E系列在相同工藝節點下比前一代D系列實現了35%的平均能效提升。其背後關鍵就在於,E-Series引入的全新爆發式處理器(Burst Processors)技術,得益於指令排程路徑壓縮、本地暫存器(每個計算單元配備近 0.5MB 寄存空間)的複用機制、矩陣乘法運算單元的整合最佳化等架構升級。與傳統NPU相比,E系列無需回退至CPU處理“未知運算元”,極大提升了系統穩定性和靈活性。


與NPU相比,E 系列的優勢不僅體現在可程式設計性與靈活性上,還在於其面向未來模型演進的架構適應能力。當前市面上的AI解決方案多采用GPU與NPU物理隔離的架構,在資料互動、功耗效率和系統成本方面均存在短板。而E系列則實現了AI計算單元與GPU圖形管線的深度整合:AI算力核心與GPU USC(統一渲染叢集)共享暫存器、快取與排程機制,打破了以往“各自為政”的瓶頸,推動圖形與AI的真正協同。

這種設計不僅提高了資源利用率,更帶來了資料路徑的顯著壓縮,有效降低了推理延遲,尤其適合圖形增強類AI場景:如影像超解析度、場景理解、光照遮蔽計算、景深識別等。它還相容Vulkan、OpenCL等主流計算介面,程式設計生態友好,具備廣泛的開發者支援基礎。
“很多 NPU 在設計時只能適配當前主流模型(如CNN),一旦未來模型發生變化(例如 Transformer 或多模態網路),現有NPU將無力支援,而 GPU 的程式設計靈活性則確保了其長期適應性。”這一點對於生命週期長達十年以上的車規級晶片尤其重要。Imagination發言人指出。
算力飛躍:從輕量級到多模態的全場景覆蓋
在算力層面,E系列Neural Cores(神經核)支援2TOPS至200TOPS的AI算力覆蓋,支援從輕量級終端到複雜多模態系統的全場景部署。4核1.6GHz配置下,圖形填充能力可達400Gpixels/s,FP32浮點運算能力13TFLOPS,而INT8推理效能更是達到驚人的200TOPS。這種單位面積下的算力密度比前代提升了3.6倍,遠超傳統GPU架構的效能曲線。
同時,E系列也支援包括FP32、BF16、FP8、MXFP4等多種AI主流格式,結合Imagination最佳化的計算庫與圖最佳化編譯器,開發者可透過TVM等框架便捷地完成PyTorch、TensorFlow等主流模型的部署與適配。
靈活擴充套件與多工並行
在任務排程層面,E系列支援多達16個虛擬機器例項的執行隔離,且可透過我們的硬體虛擬化實現AI、圖形、UI等多工的非同步並行處理。其在Cockpit域、娛樂域、駕駛輔助域等多種車載場景中已展現出良好的適配能力。例如,在智慧座艙中,E系列可同時承擔儀表渲染與人機互動AI任務;在駕駛域內則實現對駕駛員狀態的AI監控及語音互動響應。

此外,E系列支援從單核0.25T FP32輕量部署至多核200T強算力橫向擴充套件,具備覆蓋移動裝置、工業終端、AI PC乃至邊緣資料中心的彈效能力,為SoC廠商提供從單晶片整合到異構協同的多元路徑選擇。
生態完備,打通從模型到晶片的部署閉環
軟硬體協同是邊緣AI落地的關鍵一環。Imagination為E系列配套構建了完整的軟體棧支援:包括數學計算庫、FFT、Kernel最佳化、TVM適配、Graph Compiler、TensorRT Lite推理鏈,以及多作業系統、編譯器工具與除錯套件。開發者不僅能完成離線模型部署,還能實現輕量級應用的線上部署及推理推送,從而支援包括自動駕駛、移動裝置、工業終端等在內的多種邊緣場景的動態智慧需求。
值得一提的是,Imagination在RISC-V生態中也扮演著關鍵角色。憑藉其卓越的圖形與AI能力,已與多家RISC-V平臺客戶進行整合驗證,並將持續推動開源硬體與高效算力在邊緣智慧中的協同演進。
從實際落地來看,Imagination已為E系列規劃了多個子系列產品,分別面向功能安全需求的汽車域控(EXS)、消費電子(EXT)、以及AI PC等高效能領域(EXD)。我們可與客戶協作開發配置方案,以適應從輕量級裝置到複雜多模態系統的廣泛需求。在Imagination看來,在AI模型迭代迅速、多模態計算需求上升的趨勢下,GPU以其靈活可程式設計的特性,展現出相較NPU更優的可拓展性與生命週期優勢,尤其適用於未來十年仍需持續升級的車載平臺。
首款E-Series GPU IP將於2025年秋季正式上市,目前已完成授權。汽車、消費電子、桌面及移動版本亦在同步開發中。隨著正式釋出日期臨近,該系列產品有望在中國市場掀起一輪邊緣算力升級的新熱潮。Imagination 公司中國區董事長兼亞太總裁白農強調,中國是Imagination全球最重要的戰略市場之一,公司將持續加大本地化投入,深化與本土生態的合作。
寫在最後
E系列GPU IP是Imagination技術積澱的里程碑,不僅在效能、功耗和芯片面積上實現突破,更透過架構創新,從傳統圖形渲染邁向通用AI計算。面對邊緣AI應用的爆發式增長,尤其在輕量大模型(如DeepSeek)快速發展的背景下,E系列以圖形渲染與AI推理的統一計算平臺,為客戶提供更高靈活性與競爭力。
AI的未來,在雲,更在邊。Imagination E系列代表著GPU與AI融合的一次正規化躍遷,不僅在效能與功耗之間找到了新的平衡,更透過深度整合與軟硬體協同,為邊緣智慧提供了一種更具擴充套件性、靈活性與經濟性的技術解法。
END
👇半導體精品公眾號推薦👇
▲點選上方名片即可關注
專注半導體領域更多原創內容
▲點選上方名片即可關注
關注全球半導體產業動向與趨勢
*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。

今天是《半導體行業觀察》為您分享的第4028期內容,歡迎關注。
推薦閱讀



『半導體第一垂直媒體』
即時 專業 原創 深度
公眾號ID:icbank
喜歡我們的內容就點“在看”分享給小夥伴哦

