

作者 | 雲鵬
編輯 | 漠影
DeepSeek的火爆給全球AI產業發展帶來的核心價值之一,就是極大加快了AI應用的普及,尤其在國內市場,幾乎各類產品都在增加與AI能力的融合。
這意味著AI大語言模型將不再只是在天上飛(侷限於雲端),更是可以真正落地在我們身邊生活中的裝置上,走向邊緣和端側,而IoT市場作為邊緣智慧的代表性領域,成為這波邊緣AI的最大關注點之一。
今天,隨著AI技術的快速發展,IoT等邊緣AI領域也逐漸涉及更復雜的演算法,且湧現出了更多的邊緣AI推理需求。這樣一來,應用對計算效能以及算效比的需求越來越高,與此同時,資料安全問題也愈發凸顯。
從智慧城市、智慧工業、智慧家居、智慧穿戴到新零售,AI技術的廣泛應用帶來了AI計算需求和安全性方面的新挑戰。面對這些新的需求,行業正呼喚新的解法。

就在昨天,Arm釋出了全球首個專為物聯網最佳化,以全新的Cortex-A320 CPU和Arm Ethos-U85 NPU為核心的Armv9邊緣AI計算平臺。它不是CPU和AI加速器的簡單堆疊,而是實現了CPU和NPU深度融合、相得益彰的解決方案。

這是Armv9架構諸多優勢特性首次在IoT市場落地,其在效率、效能和安全方面的升級直指當下邊緣AI新需求。與此同時,Arm還將軟體層的KleidiAI拓展到了IoT領域,使邊緣AI開發進一步簡化。
Cortex-A320如何解決以IoT為代表的邊緣AI領域行業需求痛點、Armv9帶來了哪些關鍵技術升級?軟體層面的新進展又如何加速IoT領域的技術創新、應用落地?我們將嘗試找到答案。
01.
邊緣AI風暴來襲
算力和安全成兩大IoT突出難題
近年來,隨著AI技術的發展和廣泛應用、計算需求快速增長,越來越多AI工作負載從資料中心和雲端轉向邊緣側進行處理,這給人們的生產和生活帶來了切實的益處,但同時也帶來計算效能瓶頸、安全挑戰等問題。

比如在工業質檢領域,AI視覺質檢系統每帶來1%的產線漏檢率降低,可能意味著千萬級的成本節約,但在複雜的工廠條件下實現這1% 的小目標,從技術上來講絕非易事;汽車行業,自動駕駛與駕駛員的生命安全息息相關,它的成功應用需要雷射雷達、攝像頭等感測器的資料需要在100ms內融合並被模型處理。
智慧醫療領域,邊緣AI系統透過即時分析監護儀資料,預警相關病症的早期症狀,這一過程的高效與精準,高度依賴於底層晶片的效能表現,算力不足導致的預警延遲以及預測準確率下降,都會極大影響到病人的健康。
未來隨著AI高畫質影片即時分析、AI工業裝置故障檢測等複雜任務需求越來越多,邊緣AI計算能力的重要性愈發凸顯。IoT領域正呼喚從晶片架構到演算法層的全面革新,進而真正釋放AI帶來的革命性潛力。
在計算效能、效率之外,邊緣AI的發展同樣帶來了資料安全層面的風險。在邊緣計算中,隨著越來越多的邊緣AI裝置接入網路,資料在邊緣裝置和雲端或者其他邊緣裝置之間傳輸,容易受到網路攻擊。
因此面對邊緣AI迅猛發展,邊緣裝置必須具備更強的推理能力、更安全的計算架構。
從行業視角來看,傳統邊緣側裝置所使用的晶片以無法滿足越來越多的即時AI處理、計算密集型推理任務。
在昨日的Arm新品釋出會上,Arm物聯網事業部業務拓展副總裁馬健提到,在她近期與許多合作伙伴針對邊緣AI的交流中,大家一致的反饋是,AI將使他們重新定義產品設計——把具有Transformer這種加速功能的 AI 加速器加進去,或者採用能夠更好支援AI的CPU。

▲Arm物聯網事業部業務拓展副總裁馬健
IoT產業對於在邊緣側也能擁有更高效能的Cortex-A級別的計算能力以及升級至Armv9架構的需求十分突出,Arm的邊緣AI平臺新品,可以說是直指痛點。
02.
10倍AI計算效能
異構計算擴充套件場景適應力
支援Armv9 四大安全特性
基於這樣的行業背景,Arm此次推出了首款基於Armv9架構、專為邊緣AI設計的 Cortex-A CPU——Cortex-A320,以及結合了Cortex-A320和Ethos-U85的邊緣AI計算平臺。
在AI計算效能和能效提升方面,Cortex-A320相比Cortex-A35最高有著10倍的AI計算效能提升,相比Cortex-A53也有6倍以上的提升,這對於增強邊緣裝置的推理能力十分關鍵。

相較Cortex-A520,Cortex-A320的能效提升可以達到50%,在相同芯片面積下,Cortex-A320較Cortex-A53有著15%的效能提升,相較Cortex-A35有30%左右的效能提升。
這樣的效能和能效提升反應在產業落地端,究竟能夠帶來怎樣的改變?
以一個貼近日常的例子來說,相較於Cortex-M系列,Cortex-A320在記憶體定址能力、整體效能以及安全防護上均實現了顯著提升,這使得它能夠遊刃有餘地支撐起多種人機互動場景,特別是對影片流等視覺互動應用有著出色的支援。
設想一下,在某個重要的展覽會上,你偶遇了一位熟人,卻一時想不起他的名字,這時,你的智慧眼鏡就能即刻為你識別並提供對方的資訊,甚至還能貼心地在你的視線中嵌入演講要點,助你實現“即興”發言。
隨著技術的不斷進步,智慧眼鏡這類邊緣裝置正逐步成為我們生活中的得力助手,讓我們得以釋放雙手,去專注於更多想要完成的事情。
Arm Cortex-A320帶來的不僅是技術引數的變化,在部分領域甚至可以帶來商業模式升級重構。邊緣AI的算力躍遷,本質是在重構人、機器與物理世界的互動正規化。
除了效能和能效的提升,異構計算的特性支援也同樣重要。
這次Arm的Cortex-A320與Ethos-U85 NPU一起組成了CPU+NPU協同計算架構,形成完整的異構計算平臺。要知道,Ethos-U85是Arm Ethos-U產品線中的第三代NPU,也是迄今為止效能和能效最強的Ethos NPU,與上一代產品相比,其效能提升了4倍,能效提高了20%。
基於異構計算能力,任何開發者們不希望在Ethos-U85上執行的AI操作,都可以回退到Cortex-A320上,利用其Neon/SVE2引擎更靈活有效地在CPU上執行。
這樣一來,智慧物聯網與消費類電子生態系統能夠在正確的時間、合適的地方執行最適合的工作負載。
CPU與NPU的深度融合之下,新的AI計算平臺可以覆蓋更多應用場景,實現包括視覺和自然語言在內的多模態的環境感知與理解,進而執行AI智慧體、自主規劃、執行復雜任務。
8倍的機器學習計算效能提升,令其可以賦能邊緣AI裝置本地執行超過10億引數的大模型,讓基於大模型的生成式AI更好地在物聯網領域落地。
值得一提的是,在當下AI大模型需求較高的記憶體訪問效能方面,Cortex-A320支援更大的可定址記憶體空間,能更靈活地管理多層次記憶體訪問延遲。同時Cortex-A320還能執行功能更豐富的作業系統,讓裝置管理更靈活。
最後在安全性方面,Armv9支援MTE(記憶體標記擴充套件)、PAC(指標認證)、BTI(分支目標識別)以及S-EL2虛擬化,可以給邊緣裝置提供端到端的安全防護。
整體來看,在硬體層面,Arm的Cortex-A320與Ethos-U85異構計算平臺是實實在在地幫助企業解決了效能、能效和安全方面的邊緣AI新需求。Armv9架構層面的諸多優勢特性,開始給IoT領域企業帶來AI創新和應用落地的加速。

據悉,這次Arm釋出的邊緣AI計算平臺已經獲得亞馬遜雲科技、西門子、瑞薩電子、研華科技等廠商的支援。
03.
Arm軟體大招落地IoT
邊緣AI規模化應用提速
當然,Arm的完整解決方案不止於此。硬體是基礎,軟體是加速器,軟硬體組合拳才能更高效地解決邊緣AI痛點,此次Arm還同步將KleidiAI引入IoT領域,加速AI應用在邊緣落地。
縱觀行業發展,完善的軟體生態可以降低開發者門檻,而軟體也一直是Arm計算平臺不可或缺的一部分。
正如前文所提到的,邊緣裝置種類繁多,硬體效能和功能差異大,在這一場景中,出色軟體技術可以最佳化演算法和模型,使AI模型能在各種邊緣裝置上高效執行。
對於邊緣裝置有限的計算資源,軟體技術可透過模型壓縮、量化、最佳化演算法等手段,在保證AI效能的前提下,降低模型對計算資源的需求,進而提高計算效率。
KleidiAI是一套專為AI框架開發者設計的計算核心,讓開發者可以無縫地在Arm CPU上獲取最佳效能,適用於各類裝置。
從去年初次面向終端市場亮相、隨後擴充套件至基礎設施領域,KleidiAI如今進一步覆蓋IoT領域,給各個領域的開發者提供所需的效能、工具和軟體庫支援。
簡單來說,Arm Kleidi軟體庫最核心的作用就是幫助開發者讓AI應用得到Arm CPU加速,因為目前全球大多數AI推理工作負載都在Arm CPU上執行。開發者不需要額外學習新工具和技能、無需複雜的整合工作,IoT應用開發門檻和成本大幅降低。
在出色的軟體生態和豐富開發工具的支援下,Arm AI計算平臺的靈活性得到了極大釋放。
這次Arm的Cortex-A320相容Linux、Zephyr、RTOS等多種作業系統,依託Arm Kleidi,可以適配Llama.cpp、ExecuTorch、MediaPipe等主流AI框架,實現70%效能提升,這對於AI應用在邊緣落地是非常關鍵的。

馬健在釋出會上特別提到,這一優勢讓Cortex-A320在多個市場領域、應用場景和作業系統之間都具有更好的靈活性,對於合作伙伴來說,選擇空間極大擴充套件,規劃產品路線時也可以更好地適配不同場景需求。
此次Arm Kleidi擴充套件至物聯網領域,進一步加強了Arm在IoT AI領域的技術優勢,吸引更多開發者和企業基於Arm架構開發IoT應用,促進上下游產業的合作與創新。
展望未來,Arm的邊緣AI計算平臺必然將在IoT生態系統中扮演至關重要的角色,各個細分市場都將從Cortex-A320中受益,Arm無疑給IoT行業帶來了更多可能性,為IoT市場的產品和應用創新打好了新的基礎。

04.
結語:IoT邊緣AI提速
Arm軟硬兩手抓
近年來,Arm持續進行平臺化轉型,此次Arm釋出首個面向IoT的Armv9處理器Cortex-A320、以及以Cortex-A320和Ethos-U85為核心的邊緣AI計算平臺,並擴充套件KleidiAI到物聯網領域,無疑是透過軟硬體協同,為邊緣AI的加速發展、應用落地增添助力,也是Arm近年積極扮演賦能AI在各領域落地的有力展現。
放眼未來,AI計算正加速從雲端走向邊緣,未來邊緣AI計算需求必然將持續增長,就像會中馬健說道的,“AI的未來在邊緣,而邊緣AI的未來屬於Arm。”我們拭目以待。

(本文系網易新聞•網易號特色內容激勵計劃簽約賬號【智東西】原創內容,未經賬號授權,禁止隨意轉載。)
