


作者 | 雲鵬
編輯 | 心緣
手機AI晶片大戰,正成為今天科技賽場上極為重要的一場較量。
從手機晶片大廠到手機終端巨頭,無一不在力挺端側AI,不論是系統級還是個性化AI的實現,都離不開AI的端側計算,而計算就離不開晶片。
尤其結合當下AI智慧體、AI OS方向成為行業共識,AI對晶片能力的需求愈發高漲,這種需求不是簡單的“TOPS”算力,而是對晶片全方位能力的考驗。
放眼國內,小米掏出自研SoC大招,玄戒O1首秀即在CPU、GPU效能方面與高通聯發科掰手腕,與蘋果A18 Pro較量互有勝負。據小米方面透露,其自研NPU架構也實現了不少細節創新。

▲5月22日小米釋出玄戒O1自研晶片
華為海思的麒麟手機晶片雖仍然受限於工藝製程,卻在架構和軟體系統層面尋找突破口,自研泰山大小核徹底擺脫Arm架構,基於自研鴻蒙作業系統的深度最佳化連年實現整機效能的提升,AI功能落地速度甚至部分超過安卓旗艦機。

▲6月20日華為開發者大會(HDC)上展示的最新手機端側AI功能,AI可以幫助使用者在拍照時進行輔助構圖
放眼全球,蘋果晶片在硬體效能方面已經遇到不少有力挑戰者,在AI掉隊之下,如何基於晶片和系統優勢實現AI體驗是蘋果當務之急;三星3nm工藝被曝良率堪憂,自家Exynos旗艦芯遲遲未能量產落地,內部團隊動盪,但其多年技術積累令其仍然是AI手機時代不可忽視的一股晶片力量。
在終端大廠加碼佈局自研晶片之時,高通、聯發科自然也感受到了壓力,高通自研Oryon架構CPU進一步實現能效比的提升,聯發科連放AI開發工具大招力求用完善生態吸引AI開發者。

▲2024年10月21日高通釋出採用Oryon CPU的旗艦SoC驍龍8 Elite
縱觀行業,雖說做手機不一定是“得晶片者得天下”,但在AI手機時代強化對晶片技術的掌控,已悄然成為巨頭們的必然選擇。

▲六大主流手機AI晶片廠商旗艦SoC及工藝情況
從工藝製程到晶片架構,再到基於晶片的AI開發生態,如今各家有哪些關鍵動作和佈局,又有哪些臺上臺下的精彩較量?我們嘗試在這場AI晶片手機大戰中洞察到更多關鍵趨勢。

6月26日,智東西聯合主辦的2025中國AI算力大會將在北京舉行!25+位嘉賓將圍繞AI推理算力、智算中心、智算叢集異構混訓和超節點技術帶來分享和討論。最終議程即將公佈,歡迎報名~
01.
2nm被蘋果搶先包圓
小米高通聯發科們要靠什麼打贏“能效比”?
為何晶片對AI手機的體驗如此重要?效能和功耗表現可以說是一切功能想要真正落地前都必須要邁過的一道坎。
對於移動智慧裝置來說,PPT中漂亮AI功能的實現,前提都是不能以犧牲手機功耗、續航為基礎,這是一條絕對的“紅線”。
十幾年來,提升晶片能效一直是智慧手機晶片行業迭代的重點,而在AI手機時代,這一需求顯得更為迫切。
從工藝製程到晶片架構設計,各家的競爭態勢愈發激烈。
工藝方面,如今旗艦手機SoC的工藝製程已經普遍來到了第二代3nm階段,包括蘋果、高通、聯發科、小米。當然,蘋果每年都會率先包圓臺積電最新最強的工藝,比如明年的2nm。
蘋果分析師Jeff Pu提到,A19 Pro晶片會採用臺積電第三代3nm製程,蘋果最快會在明年的iPhone 18系列上引入臺積電2nm工藝。

臺積電董事長魏哲家在財報電話會上曾透露,臺積電寶山廠首批2nm產能已經全部被蘋果包圓了。
高通、聯發科、小米雖然不是第一批,但目前的旗艦晶片也都用上了蘋果“同款”工藝,三星這邊雖然自家集團中的半導體部門有著先進工藝製程技術,但在量產和內部管理方面卻頻頻“翻車”,甚至原計劃的3nm Exynos系列晶片直接難產。
就在最近,三星的晶片業務被曝出偽造資料、掩蓋缺陷的醜聞,據報道,三星晶片工程師也紛紛跳槽到對家,可以說是“屋漏偏逢連夜雨”。
相比三星工藝翻車,華為海思這邊則是承壓前行,由於代工受到限制,麒麟手機晶片無法用上最新工藝製程,在晶片能效比提升方面與同代採用新工藝的旗艦晶片會拉開一定差距,作業系統和軟體層面的最佳化對整機效能提升貢獻較大。

▲ CPU多核能效曲線(紅色圓點為麒麟9020,紫色、綠色曲線為高通、聯發科旗艦芯,時間為2024年12月),來源:極客灣Geekerwan
整體來看,工藝製程的升級對晶片能效的提升固然十分重要,但工藝製程的進步在明顯放緩,手機能效比如果想要實現顛覆性提升,不能僅憑工藝升級。
臺積電在2024年的IEDM會議上提到,同面積2nm晶片的電晶體數量比3nm晶片多15%,同功耗下晶片效能提升大約15%。
在工藝之外,晶片設計層面、架構層面等更多廠商可自主把控環節的技術創新就顯得更為重要,這也是各家能夠形成差異的一部分。
02.
巨頭死磕自研架構
晶片設計掀起“真假自研大戰”
業內普遍認為,在做AI手機這事上,蘋果有著軟硬體打通的先天優勢——越深度全面地掌握底層技術,就越容易最終實現整機更好的體驗。
各家手機AI晶片的自研深度或許決定著其AI手機體驗的上限天花板。
雖然自研晶片的優勢不是絕對的,但強化對自研晶片技術的掌握,已經成為目前手機晶片領域毋庸置疑的大勢所趨。
具體來看,各家手機AI晶片自研模式有所不同,蘋果、華為、高通,基於Arm指令集,在SoC所有核心模組實現自研;聯發科、小米、三星,基於Arm指令集,採用Arm公版架構+部分模組自研。
當然,不論是哪種模式,都是毫無疑問的“自研”。簡單來說,Arm指令集就像是晶片說的“語言”,但兩個人即便都用同樣的語言來寫文章,也會有“大學生論文”和“小學生作文”的差別。
蘋果這邊的自研深度自然不必多說,甚至可以說是“斷檔式領先”。
深度自研在AI方面實則能帶來不少優勢,比如蘋果晶片的GPU模組可以針對圖形處理和AI計算進行最佳化,其神經網路引擎(NPU)更是蘋果獨特優勢,對端側AI各類功能加速都進行了深度最佳化。

華為雖然晶片工藝受限,但麒麟晶片的架構卻一直在持續迭代。據瞭解,在最新的麒麟9020這一代上,華為已經實現了CPU全部核心替換為自研泰山架構,從超大核到小核。而GPU方面也有其自研的馬良系列。

▲華為麒麟9020晶片CPU核心情況,來源:極客灣Geekerwan
實際上,華為也是在麒麟9020這一代上才實現的完全核心模組自研,此前9010的CPU小核依然用的Arm公版IP。
在AI手機這波浪潮中,華為是手機行業中第一個將大模型能力用在手機上,實現自家智慧助手升級的廠商,其自研麒麟晶片和自研鴻蒙作業系統的深度協同,讓華為即使在工藝製程受限的情況下,每年也能穩定實現一定的整機效能提升,這對於AI體驗的落地也十分關鍵。
相較於蘋果華為這種“自產自銷”的廠商,高通作為三方晶片廠商,其自研晶片的特性多少會一定程度上掣肘於安卓系統。
目前高通自研Oryon CPU已經迭代至第二代,並大規模量產應用在旗艦手機中,其自研的Adreno GPU也做了十幾年。
Oryon CPU架構的突破,幫高通在CPU單核、多核效能上都領先於同代聯發科旗艦SoC,在手機CPU能效方面穩居第一梯隊。
高通自研的Hexagon NPU,最新一代AI算力突破了80TOPS,據稱今年即將突破100TOPS,從算力絕對值層面來說,高通自研NPU有比較明顯的優勢。
聯發科、小米的CPU、GPU核心模組都是基於Arm IP授權進行定製設計,均為Arm架構;三星的Exynos CPU雖然是Arm架構,但GPU卻採用了AMD的RDNA 3架構。

▲小米玄戒O1 CPU核心,來源:小米
ISP和NPU沒有“公版”之說,因此各家都是自研定製,比如ISP方面聯發科的Imagiq、小米的自研ISP;聯發科旗艦芯NPU有42TOPS算力,小米也有自研6核NPU。
前段時間關於晶片“自研”的討論成為科技圈第一大話題,實際上,正如前文所說,晶片自研與否與是否採用了Arm架構或Arm IP授權並無直接關係。
一個手機SoC裡面包含上百個IP模組,如何讓各個模組高效、低功耗地整合在一起,並保證其協同工作,還要實現差異化優勢,這是真正的難點所在。
一位晶片行業人士告訴智東西,最難的不是“自研”,而是真正把晶片設計的每一個細節吃透,做出一個成熟好用、效能功耗平衡優秀的晶片,實際上,實現這件事的過程,就是在自研晶片。
可以看到,一方面,自研晶片核心技術可以直觀地給產品帶來效能或體驗的優勢,另一方面,晶片自研帶來的不僅是晶片產品本身,更是對一家廠商整個技術版圖的重要補全,對廠商最佳化晶片與作業系統、大模型、應用的協同都會有幫助。
不做深度自研,很難像蘋果一樣實現人無我有的優勢,強化手機AI晶片自研技術,已經成為行業的必然方向。
03.
都說蘋果AI掉隊了
怎麼突然被蘋果“反將一手”?
正如前文所說,如今早已不是“唯TOPS論”的時代,隨著端側AI快速發展,AI應用真正落地的能效表現成為行業關注焦點。
優秀模型一個接一個,但AI手機上的AI應用能否高效利用端側AI大模型能力,如何在有限的能效內更高效地執行AI,最終實現好的AI體驗,仍然存在很大最佳化空間。
在晶片本身過硬的基礎上,手機AI晶片的相關開發加速工具支援完善程度也十分關鍵。
在這方面,蘋果在今年WWDC上,邁出了非常關鍵的一步——向所有App開放許可權,允許App直接訪問蘋果智慧核心的裝置端大語言模型。

如何訪問?蘋果釋出了基礎模型框架,也就是如今業內常常被討論的蘋果開源機器學習框架(MLX),讓開發者可以使用蘋果的模型,開發工具層面的App Intents則讓開發者能在整個系統中關聯自己App的內容和功能。
具體來看,蘋果MLX支援Python、C++、C和Swift等多種主流程式語言,根據GitHub資訊,其API對於開發者來說熟悉易用,同時支援函式變換的組合性、延遲計算模式、動態圖構建、跨裝置執行能力以及統一記憶體模型。
在效能方面,跟傳統的機器學習框架相比,蘋果MLX記憶體傳輸開銷為零複製,同時對蘋果晶片GPU計算能力進行了最佳化,未來MLX可以直接呼叫ANE專用指令集,而其他框架大多是間接支援或有限支援;動態圖響應速度方面,MLX能達到毫秒級,PyTorch為秒級,TensorFlow則需分鐘級。
對於開發者們來說,MLX的即時錯誤追蹤比傳統靜態圖框架快3-5倍,85%的NumPy/PyTorch程式碼可直接遷移,並且還可以利用蘋果晶片統一架構減少跨平臺適配工作。
可以說,蘋果MLX是全流程的開源框架,從模型訓練到推理的端側最佳化,並且深度整合了自家的硬體。
安卓陣營中雖然沒有能完全對標蘋果MLX的開源機器學習框架,但在開發者提效降本方面也都發布了各自的軟體平臺或開發工具。安卓陣營的晶片廠商更多透過閉源SDK或開源協作的方式支援AI開發。
比如高通的AI軟體棧,可以讓開發者在手機上市幾個月前,透過高通Device Cloud,基於驍龍8 Elite開發AI應用服務,進行除錯、最佳化。AI應用可以透過ONNX、DirectML等框架和高通AI軟體棧,實現NPU的加速。

▲高通AI軟體棧
聯發科這邊則有天璣開發工具集(Dimensity Development Studio),比如其中的Neuron Studio能基於神經網路進行自動化調優,幫開發者進行跨模型的全鏈路分析,節省調優時間。

此外,聯發科的天璣AI開發套件2.0,透過開源彈性架構提升開放度,模型庫適配的模型數量提升了3.3倍,對DeepSeek這樣的熱門模型的關鍵技術實現端側支援,提升tokens的生產速度。
總體來看,讓AI晶片的能力可以被開發者高效地用到AI應用中,實現更好的端側AI體驗,這事目前仍然只有蘋果做的是最完善的,安卓陣營並非不做,但生態層面的不統一、各自為戰仍然會帶來很大挑戰。
04.
結語:手機AI晶片之戰
不能輸的硬仗
在AI手機高歌猛進之下,手機AI晶片走到了舞臺C位,成為巨頭兵家必爭之地。
雖然蘋果看似在AI功能落地的“豐富度”上少了些驚豔感,但仔細梳理卻能看到其AI功能端側實現佔比極高,其從底層晶片、作業系統到大模型、應用的打通,是安卓陣營極難段時間追趕的。
蘋果AI誠然有其內部深層次問題,從團隊到技術,但歸根結底,蘋果依然按照他最擅長的做法——小步快跑,來做AI,蘋果確實在“架橋鋪路”上花費了更多時間,但一旦打好地基,AI大廈的上限將充滿巨大想象空間。
這也是安卓陣營從終端廠商到晶片廠商都不斷加碼晶片自研技術佈局的重要性所在。真正好的端側AI體驗,離不開這些底層技術的支撐。
毫無疑問,AI的到來給手機晶片市場注入了新的活力,帶來了新的變數,能否做出好的手機AI晶片將成為決勝AI手機之戰的關鍵。

(本文系網易新聞•網易號特色內容激勵計劃簽約賬號【智東西】原創內容,未經賬號授權,禁止隨意轉載。)
2025中國AI算力大會預告

