DeepSeek後更大的機遇:AI端側推理創新|智在終端

明敏 魚羊 發自 凹非寺

量子位 | 公眾號 QbitAI
每年開春的“新機潮”,今年出盡風頭的是DeepSeek。
一時之間,幾乎所有主流消費終端廠都在短時間內完成DeepSeek的接入。
榮耀、OPPO、魅族、vivo、小米紛紛官宣自家AI助理上線DeepSeek-R1及其滿血版;甚至OPPO今年新發的旗艦大摺疊Find N5,也強調了對DeepSeek的支援。
另一個被掀起鯰魚效應的是車圈。
一個月內,吉利、比亞迪、奇瑞、嵐圖、長城、理想等超過20家車企宣佈接入DeepSeek,形成汽車與AI加速融合的一個切面。
熱潮之下是技術洪流不斷向前湧動——
AI正在進入推理創新時代。
如此趨勢認知來自高通。DeepSeek效應從AI領域向外輻射,從演算法創新逐漸演變成對每個人生活工作的潛在影響。
輻射普羅大眾,消費終端是關鍵橋樑。
由此,在當下節點,一份對AI端側趨勢的梳理就變得尤為重要。高通最新發布的白皮書《AI變革正在推動終端推理創新》,已梳理出四大趨勢:
  • 先進AI小模型已具有卓越效能
  • 模型引數規模正在快速縮小
  • 開發者能夠在邊緣側打造更豐富的應用
  • AI正在成為新的UI
透過這份行業分析,AI推理之於終端將產生哪些影響?也就有更明瞭了。

AI正在進入推理創新時代

最首要的問題,DeepSeek這條“鯰魚”究竟改變了什麼?
之於行業內,大模型端側趨勢早已是暗流湧動。在ChatGPT爆火後,高通就提出了混合AI的概念。
它強調,隨著生成式AI不斷發展,AI處理必須分佈在雲側和終端進行,才能實現AI的規模化擴充套件併發揮其最大潛能。它幾乎適用於所有生成式AI應用和終端領域,包括手機、筆記型電腦、XR頭顯、汽車和物聯網。
從當時來看,節省成本是推動混合AI架構的主要因素之一。一次AI問答所需的成本是傳統搜尋的1000倍,混合AI能夠透過和終端裝置協同算力的方式,降低雲端計算的成本。同時兼顧個性化、隱私保護等需求。
這也造成了部分AI體驗被閹割的問題。由於當時推理Scaling Law(語言模型中的規模化法則行為)尚未被提出,模型能力與引數規模呈強烈正相關,儘管廠商們也陸續推出小型號模型適應端側需求,但效能和精度水平仍舊受到限制。
在實際進展上,高通在過去幾年先後釋出的第三代驍龍8、驍龍X Elite和驍龍8至尊版等平臺上,開始強化終端晶片對生成式AI能力的支援。手機、PC廠商們在此基礎上進一步發力,陸續推出本地支援AI能力的新機,AI端側應用迎來一波小趨勢,不僅手機助手都更加智慧化,也衍生出AI一鍵消除路人、AI語音通話總結等原生AI端側應用。
可以說,在過去幾年,端側AI已搭建好初步的框架和地基。若有更強勁的東風,這股新趨勢便將進一步爆發。
高通技術公司高階副總裁兼技術規劃和邊緣解決方案業務總經理馬德嘉(Durga Malladi)近期的採訪,進一步驗證了外界的猜測:
我們在去年11月份的時候已經做出了這樣的預判,會有越來越多的高質量模型在搭載驍龍平臺的終端側執行,讓開發者能夠在邊緣側打造更豐富的應用。
果然,在2025年,推理模型DeepSeek-R1這股東風到來。它從模型層面為困擾端側AI已久的成本問題,提供了全新解決思路。
透過使用思維鏈推理資料和非推理資料微調,並進行蒸餾,DeepSeek-R1實現了將推理能力賦予到小規模稠密模型上
這意味著,高質量且小規模的模型並非不可能實現。DeepSeek一聲驚雷過後,這樣的模型只可能比人們預想中的還要多、還要實惠
由此,高通對當下趨勢進行梳理,在白皮書給出四大值得參考的方向。一方面是為了在發展中總結經驗,另一方面也是與行業一起探討前路方向。
其中,第一點被提及的還是快速進化的AI模型。
現如今,不僅模型質量在進一步提高,開發方式其實也在變得更便捷。
經過多年探索,目前AI領域內針對不同模型需求,已經形成了諸多正規化。
比如針大規模模型,可以使用MoE(混合專家模型)、SSM(狀態空間模型)等架構來降低計算開銷,同時保證模型質量;使用思維鏈和自我驗證等,能夠大幅提升模型在數學、編碼、推理等方面能力;對於小模型,蒸餾技術的普遍應用能夠讓大模型“教學”小模型,保持準確性的同時遷移知識,進一步降低開發難度,一定程度上避免重複造輪子。
其次,從全行業範圍看,模型引數規模正在快速縮小
量化、剪枝、蒸餾等技術下,大模型的效能可以很好遷移到小模型上。
基於通義千問模型和Llama模型的DeepSeek蒸餾版本,在GPQA基準測試中,與GPT-4o、Claude 3.5 Sonnet和GPT-o1 mini等先進模型相比,取得了相似或更高的分數。
此外,讓模型更“濃縮精華”也是正在發生的趨勢。根據Epoch AI整理的資料,2024年釋出的大規模AI模型中,超過75%的模型引數在千億規模以下。
第三,高質量模型激增,開發者有了更多選擇,邊緣側的AI應用正在滲透到普通使用者的日常用機習慣中。
比如文件摘要、AI影像生成和編輯以及即時語言翻譯,已經成為如今AI手機上的常見功能。影像方面更是可以利用AI進行計算攝影、物體識別和場景最佳化。
這些都得益於AI推理在終端側的廣泛普及。
由此更進一步,AI正在成為新的UI。
隨著大模型入駐手機、PC,傳統的螢幕互動正在被變革、顛覆,個性化多模態AI智慧體可以簡化人機互動流程,高效地跨越各種應用完成任務。
比如榮耀去年火出圈的“一句話點咖啡”,就是一個例子。
當然還不止於手機、PC、汽車等消費級終端,未來在機器人、無人機以及其他自主裝置上,AI也有望實現即時決策,在動態的真實環境中實現精確互動。
綜上,隨著AI進入推理時代,終端側的創新與應用落地被進一步激發,AI格局甚至都將就此發生改變。
那麼問題來了——

AI推理時代需要什麼?

DeepSeek-R1的蒸餾模型,在問世不到兩週時間內就被爭相接入各種終端,令不少業內人士都驚歎不已。
而在DeepSeek之外,值得關注的是,大部分接入的終端產品都是“高通芯”
關鍵的一點是,在DeepSeek攪動風雲之前,高通就已經進行了前瞻預判:AI計算處理將從雲端向邊緣側擴充套件
2023年5月,高通釋出了《混合AI是AI的未來》白皮書,其中提到:
AI處理必須分佈在雲端和終端進行,才能實現AI的規模化擴充套件併發揮其最大潛能。
而決定程序的影響因素包括:終端能力、效能需求、隱私和安全需求,以及商業模式等諸多因素。
簡單歸納,核心回到3個問題:
  • 硬體設計是否能滿足模型對終端算力的需求?
  • 相比雲端模型,終端“小”模型是否足夠好,足夠多,足夠便宜?
  • 打通軟硬體的AI Infra(人工智慧基礎設施,連線算力和應用的AI中間層)是否完備,終端側的生態系統是否健全?
圍繞這3點,再回溯高通這兩年以來的技術佈局,不難看出,高通在終端AI領域,再次引領了時代之先。
首先,是高效能、高能效的晶片設計
高通長期致力於開發定製CPU、NPU、GPU和低功耗子系統,同時擁有封裝技術和熱設計的技術專長,構成了其行業領先系統級晶片(SoC)產品的基礎。
這些SoC能夠直接在終端側提供高效能、高能效的AI推理。
比如,驍龍8至尊版除了在對AI最為關鍵的NPU上帶來一系列升級,在CPU和GPU上同樣做了不少文章,以更加充分地釋放SoC的AI能力。
包括引入自研Oryon CPU,應對對時延敏感的AI任務,比如即時翻譯、AI助手命令響應等,並負責將AI任務分配到其他核心上。
而驍龍8至尊版的Hexagon NPU,目前已經可以支援70+ Tokens/秒、4K上下文的生成能力;併為應對多模態AI任務增加了額外的核心。
又比如驍龍X系列平臺,其專為實現高效能、高能效的生成式AI推理而打造的NPU核心,對定義全新AI PC品類發揮了關鍵作用。

MWC2025高通展區畫面
其次,是覆蓋所有關鍵邊緣細分領域的可擴充套件性
不僅是手機、PC,在XR頭顯和眼鏡、智慧汽車,以及工業網際網路等諸多終端場景中,高通的身影無處不在,並代表著最先進的技術水平。

MWC2025中高通展區展出搭載驍龍XR平臺的終端
而在所有這些場景中,高通始終在更加積極、極致地融入、提升AI能力。
比如在本屆MWC上,高通釋出高通躍龍第四代固定無線接入(FWA)平臺至尊版,基於高通X85打造,支援長達14公里的毫米波遠端通訊——
高通提到,毫米波覆蓋範圍的擴大得益於AI最佳化和AI輔助波束選擇技術。
而其流量分類智慧網路選擇等AI功能,也是基於X85這顆5G AI處理器的AI能力實現的。
又比如驍龍數字底盤解決方案,在其情境感知智慧座艙系統中使用終端側AI,旨在增強汽車安全和駕駛體驗。該系統利用先進攝像頭、生物識別、環境感測器以及先進的多模態AI網路,提供根據駕駛員狀態和環境條件而調整的即時反饋和功能。
針對自動駕駛和輔助駕駛系統,高通開發了端到端架構,利用大規模訓練資料集,基於真實世界資料和AI增強資料的快速再訓練、OTA更新以及包括車內多模態AI模型和因果推理在內的先進軟體棧,應對現代自動駕駛和輔助駕駛的複雜性。
目前,高通的硬體和軟體解決方案已賦能數十億智慧手機、汽車、XR頭顯和眼鏡、PC以及工業物聯網等終端,為廣泛行業帶來高效能、經濟實惠、快速響應和關注隱私的變革性AI體驗。
值得關注的是,硬體之外,透過高通AI軟體棧、高通AI Hub和開發者協作,高通已構建起完備的生態系統策略,面向不同邊緣終端領域的模型部署提供工具、框架和SDK,賦能開發者在邊緣側加速AI智慧體和應用的落地。
也可以這樣理解——透過高通生態的支援,開發者面向不同平臺進行重複開發時,只需一次開發,即可輕鬆實現跨多平臺高效部署。
毫無疑問,大模型從雲端擴充套件到終端的過程中,蘊藏著巨大的機會——
甚至可以說,這是這場“模力時代”變革之中,能最快觸達最多人群、引發新爆點的應用領域之一。
而機會總是率先青睞有準備的人,每一次技術變革中,引領潮流的都是有更長遠預判,以及孜孜不倦深耕、賦能行業未來的企業、團隊。
現在,在AI推理創新時代的開端,以高通為代表的技術上游已經站上潮頭,亮出越來越令外界驚喜的手牌,推動著整個行業加速發展。
更多的創新創造,正在湧流。
至少終端側的智慧新可能,已經在2025,初現曙光。
—  —
一鍵關注 👇 點亮星標
科技前沿進展每日見
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!

相關文章