Arm釋出全球首個Armv9邊緣AI計算平臺,賦能物聯網未來,迎接AI革新

作者:李寧遠
在當前 AI 革新的推動下,千行百業正在發生深刻的變革。AI 已經觸及我們生活的方方面面。而且,我們僅僅處在這場 AI 革新的起步階段,未來可期。
在 AI 百模大戰時代,焦點在雲資料中心的集中式訓練。但是訓練本身不能產生價值,推理才是 AI 釋放價值的關鍵。當前,AI推理的熱潮正迅猛推動算力從雲端向邊緣側及端側延伸。對於晶片硬體玩家來說,邊緣側形態各異的裝置與豐富用例帶來更多激動人心的機會,而且大模型、智慧體在邊緣側的落地需要具備更高效能和能效的邊緣計算平臺。
在AI 不斷賦予邊緣裝置越來越先進的智慧性,使邊緣裝置勝任越來越重要的任務的同時,保證邊緣裝置的安全可靠將會成為邊緣 AI 大規模部署的必要條件。
針對物聯網與 AI 融合發展所面臨的行業痛點,特別是在效能瓶頸、安全性保障、系統相容性以及應用靈活性等方面的挑戰,2月27日,Arm 釋出以全新基於 Armv9 架構的超高能效 CPU —— Arm Cortex-A320 以及對 Transformer 網路具有原生支援的 Ethos-U85 AI 加速器為核心的 Armv9 邊緣 AI 計算平臺。
在日前舉行的新品技術溝通會上,Arm 物聯網事業部業務拓展副總裁馬健 (Chloe Ma) 表示,“Armv9 邊緣AI計算平臺不是 CPU 和 AI 加速器的簡單堆疊,而是實現了深度配合,讓 CPU 和 NPU 相得益彰。Cortex-A320 可以為 Ethos-U85 提供更高的記憶體容量與頻寬,讓大模型在 Ethos-U85 上的執行如虎添翼;任何開發者們不希望在 Ethos-U85 上執行的 AI 操作,可以回退到 Cortex-A320,利用其 Neon/SVE2 引擎更靈活有效地在 CPU 上執行。這使智慧物聯網與消費類電子生態系統能夠在正確的時間,並在合適的地方執行最適合的工作負載。我們相信,這一創新將推動邊緣 AI 領域在未來多年內的持續發展。”
Arm Cortex-A320 是目前最小型的 Armv9-A 架構 CPU,其微架構源自 Cortex-A520,並經過顯著最佳化,以改善面積和功耗。相較 Cortex-A520 ,Cortex-A320 的能效提高了 50% 以上,此外,透過對 BF16 等新的資料型別、新的點積和矩陣乘法指令的支援,Cortex-A320 的 ML 效能比目前全球最受歡迎的 Armv8-A CPU Cortex-A53 高出至多六倍。憑藉ML 計算能力的大幅提升,以及極高的面積能效比,Cortex-A320 成為ML 應用中最高能效的 Cortex-A CPU 核心。
Armv9邊緣 AI 計算平臺將 Cortex-A320 的革新功能帶到了邊緣側,透過可伸縮向量擴充套件 (SVE2) 等關鍵的 Armv9 特性,增強了 AI 和數字訊號處理 (DSP) 效能;同時,它還利用了記憶體標記擴充套件 (MTE) 以及透過 Secure EL2 (S-EL2) 提供的先進虛擬化支援等全面的安全特性。這些功能與 Cortex-A320 高能效的微架構相結合,使其能夠維持嚴格的能耗預算,並同時為邊緣 AI 處理開創新的可能性。
在軟體相容性與生態上,Armv9 也有諸多優勢:
  • 支援 Armv9 架構的軟體可無縫執行在所有這些處理器上,極大降低了物聯網服務部署與交付的總體擁有成本 (TCO)。
  • 開源作業系統專案和編譯器已支援 Armv9 特性,進而大幅縮短產品開發週期。
  • 軟體發行版本在整個 Armv9 架構裝置內保持相容,這不僅簡化了開發流程,同時也減少了物聯網生態夥伴在解決方案交付上的整體成本。
馬健總結道:“Arm 此次釋出的全新 Armv9 邊緣 AI 計算平臺不僅僅是一次漸進式的升級,它代表了我們為未來邊緣計算和 AI 處理提出的新正規化。Cortex-A320是我們首次專為物聯網應用設計的 Armv9 架構處理器,它將超高能效與先進 AI 能力相結合,實現了前所未有的突破。當它與 Ethos-U85 結合時,將催生出全新的應用類別,開啟無限可能。物聯網領域正在迎來前所未有的機遇與生機!我們堅信,AI 的未來在邊緣,而邊緣 AI 的未來屬於 Arm”。
物聯網與 AI 的融合正在推動算力下沉到邊緣側,而在物聯網 + AI領域快節奏的技術環境中,產品的上市速度往往決定其成敗。Arm的邊緣 AI 計算平臺確保了與更高效能 Cortex-A 處理器在軟體層面的無縫相容,這不僅代表了邊緣計算平臺的一次技術進步,更代表著行業對邊緣計算和 AI 處理方式上的根本性變革。

相關文章