
端側AI正在點亮智慧硬體的應用前景。以DeepSeek R1為代表的精簡模型,在保持效能的前提下,成功將模型引數量大幅壓縮,解決了以往端側AI儲存空間需求高、算力消耗大、推理延遲等部署難題。這意味著,端側AI能低成本、低消耗地在手機、PC、攝像頭、機器人等終端裝置執行。
在這種趨勢下,2月23日上午,深思考人工智慧(iDeepWise.ai)釋出了鴻蒙系統“TinyDongni”及“DeepSeek”超小端側多模態大模型,並宣佈與國產頭部模組廠商廣和通、深開鴻達成合作,推出適配國產算力的硬體解決方案。

深思考人工智慧,是一家專注類腦人工智慧與多模態大模型的高新科技公司,有著長期的技術積累。深思考人工智慧在多模態深度語義理解、人機互動等技術方面具有領先優勢,已將大模型深度應用於智慧醫療、智慧終端等場景中。
深思考人工智慧表示,此次合作標誌著國產端側AI技術在低功耗、高效能領域實現重大突破,打破“國產算力效能不足”的固有認知。“模型+硬體+生態”的三位一體方案,也為智慧終端廠商提供便捷的端側AI能力,加速賦能各行業。

推出超小端側
多模態大模型與算力模組
AI向終端普及的前提是擁有足夠輕量化的端側大模型。傳統大模型能耗大、對儲存空間需求大。只有透過引數壓縮實現輕量化的模型,才能降低成本,部署到終端裝置中。
深思考人工智慧創始人兼CEO楊志明博士認為,在降低大模型引數的同時,要保持效能穩定,避免“盆景式壓縮”,導致引數減少,效果驟降。
本次釋出的TinyDongni和DeepSeek系列端側多模態大模型,都在減少引數的同時,保證了良好的應用效果。
例如,TinyDongni端側多模態大模型採用了創新量化方法,將引數規模壓縮至1.5B。在極簡引數規模中,TinyDongni實現了高效運算,還能顯著降低首Token延遲,支援32K超長上下文理解。此外,TinyDongni透過多晶片協同處理與記憶體最佳化技術,兼顧了低功耗與高響應速度。
而DeepSeek系列則聚焦多模態能力,1B模型透過2048隱藏層維度與32注意力頭設計,強化複雜場景下的語義理解。模型聚焦高頻詞與專用詞,記憶體佔用降低了30%,適配智慧硬體與邊緣計算場景。
為便捷各行業使用,深思考人工智慧還聯合深開鴻、廣和通,推出了兩大解決方案,打造“即插即用”的端側AI標準化產品。
深思考人工智慧與深開鴻深度合作,基於深開鴻智慧硬體裝置,深思考人工智慧釋出全自研、基於開源鴻蒙作業系統的端側多模態大模型,以及基於DeepSeek低位元量化模型的模組。
深開鴻模組配置了瑞芯微RK3588 晶片和OpenHarmony系統,具有較強的影像處理能力,支援8K解碼與多屏互動,將賦能工業檢測、AI攝像頭等高精度場景。
廣和通模組配置了高通QCS8550晶片,集成了高效能圖形引擎和綜合算力達48TOPS的AI引擎。依託深思考人工智慧的演算法最佳化,該模組可為車載、機器人等場景提供即時AI處理能力。此外,深思考人工智慧與鴻蒙系統已調通,並匹配了廣和通模組。
模組方案的推出,一方面降低了AI智慧硬體的技術門檻,將AI智慧硬體的開發週期縮短了50%。另一方面,在國產算力硬體上跑通大模型,也證明了深思考人工智慧技術的輕量化與高效能,其大模型無需依賴高算力硬體,即可處理複雜任務。
目前,端側多模態大模型和兩大算力模組可相容OpenHarmony、Windows、Android、linux等主流作業系統,滿足跨平臺部署需求。
其中,鴻蒙生態終端可無縫接入深思考人工智慧的AI能力。華為OpenHarmony使能部AI技術專家劉小飛表示,“OpenHarmony一直在積極探索大模型在各個領域的應用,雙方合作將加速AI PC、AI手機等智慧終端的全場景應用,推動端側AI技術普及。”

TinyDongni互動的幾大優勢
深思考人工智慧在AI領域積累深厚。核心團隊來自於中科院、清華、耶魯大學,由一線的AI科學家及業務專家組成。在多模態深度語義理解與人機互動技術方面,深思考人工智慧具有突出優勢。
2018年,深思考人工智慧就釋出了世界首個醫學影像專用AI處理器,將AI技術成功應用於智慧醫療大健康領域中。2020年,深思考人工智慧還開發了國內第一代生成式語言大模型,經過迭代後,該模型成為深思考人工智慧的核心產品Dongni.ai。
作為深思考人工智慧自主研發的類腦多模態、跨模態大模型,Dongni.ai具有多模態、可解釋性、即時性、可溯源性、輸出結果可控性、情感能力等優勢。目前,Dongni.ai已運用於智慧終端人機互動和智慧醫療兩大產品線。
基於強大的AI研發能力、以及對AI落地應用的深入理解,深思考人工智慧的TinyDongni端側多模態大模型,在搜尋引擎方面有以下特點。
首先是端側多模態互動,能提供檔案、影像、影片搜尋。其詞彙表達18.3萬,覆蓋了法律、醫療、教育等場景。同時TinyDongni具備深度語義理解模糊搜尋能力,大幅提高搜尋效率。深思考人工智慧推出的“Her”模式,還能與使用者進行深度的情感交流與對話,在手機、電腦、機器人等終端打造個性化陪伴體驗。
其次,TinyDongni支援海外13個國家和地區搜尋。在使用中,TinyDongni可根據所選國家,搜尋海外當地語言資訊,並提供中文及當地語言兩種語言搜尋結果,大幅提高工作效率。
最後,TinyDongni學習了1687萬篇全球權威醫學論文,深度賦能醫學場景。
醫學領域是深思考人工智慧長期深耕的優勢賽道,基於“重疾早篩”這一垂直場景,深思考人工智慧完成了超10萬例臨床回顧性分析和驗證,擁有百萬級高質量資料。截至2024年,深思考人工智慧僅宮頸癌篩查量就超過了3000萬人份。
在深思考人工智慧醫學專業知識的賦能下,TinyDongni能幫助醫學使用者提升工作效率,還為普通使用者提供專家諮詢、健康報告單解讀等服務。

推動AI普惠,賦能各行業
事實上,深思考人工智慧端側多模態大模型已在多個領域落地。
例如,在儲存領域,利用深思考的輕量化大模型技術,可對儲存裝置的資料進行多模態搜尋,透過自然語言來實現對儲存中的資訊,進行語義級別地搜尋圖片、影片、檔案。
在醫療領域,深思考人工智慧聯合打造的醫學顯微鏡,在本地離線執行,能確保資料安全。該醫學顯微鏡還能載入可拓展AI分析模組,透過加密分析與擴充套件模組,提升病理檢測穩定性與效率。
此外,在AI PC Suite上,提供本地檔案模糊搜尋、PPT自動生成及同聲翻譯,保障資料安全。在智慧汽車中,TinyDongni融合手勢、語音、影像多模態互動,即時解析車內外環境。在人形和萌寵機器人中,TinyDongni的“Her”模式,也能進行良好的人機互動。
華為OpenHarmony使能部AI技術專家劉小飛舉例,2024年4月,OpenHarmony的Laval社群和深思考人工智慧,合作推出了OpenHarmony專屬智慧問答助手“小瓦AI答”。上線至今,小瓦AI答已經服務了9000多名開發者,回答了3萬多個問題。
“正是靠著深思考人工智慧Dongni多模態大模型技術,Laval社群才能服務更多開發者,即時解答問題,社群和使用者互動反饋的體驗也更好了。”他說道。
據QYResearch預測,全球端側AI市場規模將以超20%的年複合增長率擴張,2025年達數百億美元。相關分析也指出,到2028年端側推理和微調卡銷售額將超過雲側訓練卡,標誌端側商業模式的重大轉變。
端側AI將成為AI普惠化的重要支柱,重塑產業鏈格局。在端側AI的發展浪潮中,深思考人工智慧創始人兼CEO楊志明認為:“深思考鴻蒙系統TinyDongni&DeepSeek超小端側多模態大模型及硬體模組的釋出,不僅是技術突破,更是端側AI普惠化的里程碑。未來,深思考人工智慧將持續最佳化多模態互動能力,推動AI在醫療、工業、消費等領域的深度應用。”
