離線+記憶,大模型進化的分水嶺

下一代通用人工智慧的基石:
大模型記憶機制

今年的WAIC,依舊火爆。
悶熱的上海、擁擠的展臺、扎堆的AI大模型——這些都是歷年WAIC的常態,但今年有些變化。
今年的WAIC上有一個顯著的風向標:無論是參展企業還是逛展使用者,人們對大模型這一概念已經祛魅,取而代之的是每個人都在問:“有沒有落地案例?”
經過了三年的市場教育,使用者早已對一遍遍的“模型刷榜”感到疲倦。尤其是2025年開年至今,DeepSeek橫空出世,一大批AI“明星專案”應聲折戟,創業明星們急了,投資人也急了。
有沒有不急的呢?還真有。
據36氪瞭解,有一家上海AI大模型創企,已經“悄悄”把它的模型技術賣到了世界各地,足跡遍佈非洲、中東、歐美、東南亞、俄羅斯……
它主打“離線智慧”,將離線大模型的部署邊界下探到“千元機”級別,讓非旗艦款、甚至是入門款的AIPC、手機、無人機、機器人都能夠實現離線狀態的即時AI運算——在網路環境極其不穩定的歐、非、俄、中東等地,這幾乎是“剛需”中的“剛需”。
這家公司在宣發上極其低調,很少對外PR,也不做大規模宣傳。他們團隊內部曾有一句戲言,“我們不裝‘高大上’,我們去‘打穿華強北’。”
普通人聽著像自謙,但業內人聽著倒吸一口涼氣——深圳華強北什麼地方?全國,乃至全球科技電子炮火最密集的戰場,“一天開模、三天量產”的奇蹟之地,“走出國門、邁向世界”的主陣地,也是競爭最慘烈的“近身肉搏”“刺刀見血”修羅場,也誕生了無數電子科技產業的“水下獨角獸”。
這家創企叫RockAI(上海巖芯數智),在WAIC 2025期間,我們終於找到機會和它深入聊了一聊。
神秘的“水下獨角獸”
RockAI成立於2023年6月,是A股上市公司巖山科技的控股子公司,其核心產品是國內首個非Attention機制的Yan架構通用大模型系列,能夠讓堪稱“算力巨獸”的AI大模型離線部署在低功耗裝置上,無需聯網,即時運算。
RockAI所實現的離線智慧,並不是簡單地對“大模型”進行蒸餾、剪裁得到“小模型”,而是從底層架構開始顛覆,走了一條不同於OpenAI、不同於Meta、不同於DeepSeek,也不同於任何大模型公司的道路。
在本屆WAIC期間,RockAI還推出了最新一代Yan 2.0 Preview大模型,將多模態能力進一步拓展到影片領域,並引入了基於神經網路的記憶單元,讓模型擁有自主學習能力。
低功耗、高效能、離線智慧、非Transformer,這幾個是RockAI身上最顯眼的標籤,也是客戶最終選擇RockAI的原因。
離線智慧
在今年3月的MWC(巴塞羅那世界行動通訊大會)上,部署RockAI大模型的AIPC產品在該品牌方的展區展出,現場的反饋堪稱“炸裂”——歐美、非洲、俄羅斯等地的經銷商幾乎當場拍板銷售意向,隔壁展區的友商探頭探腦地過來圍觀,神秘兮兮地問:“這個價格居然能做到離線?”
實際上,海外使用者對於AIPC的離線需求,非常強烈。
舉個例子,RockAI產品中最受海外使用者歡迎的功能之一,是智慧會議助手,它能在線上會議期間幫使用者進行即時文字轉錄、翻譯、會議記錄、會後總結等。
聽起來像國內“社畜”的日常,但是,大量海外企業有著極其嚴格的資料安全制度,商業會議的資料不允許發到雲端處理。
這時候,離線的智慧會議助手稱得上是“救星”了。
此外,網路設施的穩定性也是海外使用者的日常痛點。享受慣了國內5G高速網路的裝置剛去海外往往會“水土不服”,網路昂貴而不穩定、時常掉線不說,轉圈轉了10分鐘,最後返回網路錯誤資訊才是真正的崩潰時刻。
即便在國內,也有大量品牌商、ODM廠商對於大模型本地化、產品差異化升級有著強烈需求。
例如,曾經人臉識別、語音識別、OCR拍照識別等AI能力都是旗艦產品的獨有功能,但隨著演算法、晶片、麥克風、攝像頭模組等一系列產業鏈創新,如今這些功能如今成了“千元機”的標配,不少AI功能甚至下放到了離線的檯燈、冰箱、洗衣機、電飯鍋上,進一步拓展裝置智慧的邊界。
這是所有前沿技術的必經之路,大模型也不例外。
當前,搭載RockAI模型的裝置出貨量已經初具規模,其客戶不僅有上文提到的消費電子品牌方、ODM廠商、手機、機器人、車載晶片等,還有大量對功耗、效能要求更為極端的家電、XR眼鏡等廠商前來尋求合作——這些嗅覺最為敏銳的廠商,許多來自華強北。
社交媒體上各類“AI入侵華強北”
大模型的記憶力
在今天,當“百模大戰”幾乎全面熄火,大量明星創業專案急著轉型、上市、同樣喊出“顛覆Transformer架構”的口號時,RockAI的大模型卻已賣到了世界各地,其積累的龐大而豐富的技術資源、工程化經驗,足以甩開對手幾個身位,成為大模型這一賽道中最低調、卻又最不容忽視的“水下獨角獸”。
而RockAI的真正野心,遠不止一臺電腦、一部手機、一個家電裝置的智慧化。
它想要的,是那個所有AI從業者夢寐以求的東西——通用人工智慧(AGI),而記憶則是本次Yan 2.0 Preview的核心,他們展示的機器狗,活靈活現的體現了什麼是大模型的“記憶”能力。
在傳統大模型中,知識往往依賴外掛式的呼叫(如RAG),而搭載Yan 2.0 Preview的機器狗透過將記憶深度融合進模型引數,實現了真正意義上的“長期記憶”與個性化理解。這種記憶不是臨時儲存,而是一種隨著使用者互動逐步演化的智慧積累,讓裝置具備“瞭解你”的能力,成為使用者思維的延伸,而不僅是工具。
更關鍵的是,端側部署讓這一切發生在本地終端,保障隱私的同時也提升了響應速度和資料安全。未來的裝置將不再是被動執行指令的機器,而是擁有感知、記憶與學習能力的“數字大腦”。
人類的智慧之所以得以發展,根本在於對經驗的積累與記憶的演化——沒有記憶,就沒有學習、理解與個性形成。同樣地,大模型若想從“強大工具”邁向“智慧體”,就必須具備類人的記憶能力。只有當模型能夠記住使用者的偏好、語境與過往互動,它才有可能提供持續進化的服務,實現真正個性化的陪伴與決策支援,賦予機器以類似人的思維延續性與成長潛力。
RockAI認為,當每臺裝置都具備記憶和自主學習能力,它們不再是孤立的節點,而是能彼此協同、共享經驗的智慧體。這樣的分散式智慧網路將催生出“群體智慧”,讓系統整體遠超個體之和,形成類社會化學習機制,他們認為這是邁向通用人工智慧的關鍵一步。
結語:分水嶺上的大模型
雖然,此時此刻聊AGI還是太早了,我們把目光放回到今天,大模型已經走到了行業分水嶺。一方面,是“百模大戰”的全面熄火,一大批明星專案陷入焦慮,行業洗牌、收縮、裁員。
另一方面,卻是裝置商、品牌商、使用者對於AI大模型的大量真實需求、大量未被滿足的落地場景。
不知道大家還記不記得,2017年,華為、蘋果、三星陸續推出自家首款手機AI晶片,將轟轟烈烈的人工智慧大戰從雲側正式拉到離線端,自此拉開了近10年的全民AI熱潮。
2025年的今天,在行業一片焦慮中“逆勢增長”的RockAI,也許正映出了潮水的走向。


相關文章