加速度計成本暴降1/400!哈工大首次突破精度、量程瓶頸|AAAI2025Oral


新智元報道  

編輯:LRST
【新智元導讀】哈爾濱工業大學團隊提出HEROS-GAN技術,透過生成式深度學習將低成本加速度計訊號轉化為高精度訊號,突破其精度與量程瓶頸。該技術利用最優傳輸監督和拉普拉斯能量調製,使0.5美元的感測器達到200美元高階裝置的效能,為工業、醫療等領域應用帶來變革。
低成本加速度計憑藉體積小、易整合、可穿戴及量產化優勢,在工業自動化、醫療監測和消費電子等領域廣泛應用,但其精度受限、噪聲顯著且量程範圍狹窄的問題嚴重製約了高動態場景下的應用。
為此,哈爾濱工業大學的研究人員提出HEROS-GAN,首次透過生成式深度學習將低成本加速度計訊號對映為高成本等效訊號,突破其精度與量程瓶頸。
目前,論文已被頂會AAAI 2025接收為Oral,具有一定的理論價值和啟發性。
論文地址:https://arxiv.org/abs/2502.18064
針對無法獲取配對訓練標籤的核心挑戰,文中設計最優傳輸監督(OTS),利用最優傳輸理論挖掘未配對資料間的潛在一致性,從而最大化利用監督資訊。
同時,提出調製拉普拉斯能量(MLE),透過自適應調節特徵層能量,激勵生成器突破量程限制、增強區域性細節。
並且,文中還構建了首個低成本加速度計訊號增強專用資料集LASED。
圖1 HEROS-GAN框架圖
實驗結果表明,單獨整合OTS或MLE的GAN模型即可超越現有訊號增強方法一個數量級;而融合兩者的HEROS-GAN顯著優於最優基線,量程從8g擴充套件至16g,噪聲降低兩個數量級,使$0.5級感測器達到$200級工業產品的實測效能。
此外,文中提出物理可解釋性評估體系(CSRE/ZVRE),可以評估生成訊號的物理合理性,從而保證生成模型的可靠性與實用性。
研究背景
低成本加速度計憑藉其微型化設計、易於整合和低成本優勢,已成為現代工業自動化、醫療健康監測及消費電子領域的核心感測元件。
在工業場景中,此類感測器廣泛應用於機械臂運動控制、生產線振動監測與裝置故障預警;在消費電子領域,其支撐智慧手機的姿態互動、增強現實(AR)應用及健康監測功能;在醫療領域,則實現患者運動追蹤、康復訓練評估與跌倒檢測等關鍵任務。
然而,受限於硬體成本約束,主流低成本加速度計普遍存在兩大技術瓶頸:精度不足(訊號噪聲顯著)與動態範圍狹窄(典型量程為±2g至±8g)。
例如,工業機械臂高速運動需±16g量程以精確捕捉複雜動作,而醫療場景中跌倒檢測常需識別瞬時超10g的加速度訊號。
現有低成本感測器在高動態場景下易因訊號飽和導致資料失真或丟失,嚴重影響系統可靠性。儘管高階感測器(如Xsens系列,部分產品單價超1500美元)可滿足效能需求,但其高昂成本阻礙了規模化部署。
因此,透過智慧演算法提升低成本硬體效能,實現“低硬體成本+高演算法效能”的技術路徑,對推動高精度感測技術的普惠化具有重要戰略意義。
近年來,生成式深度學習的快速發展為感測器訊號增強提供了新思路。透過構建從低成本訊號到高成本訊號的對映模型,理論上可突破硬體固有侷限。
然而,此類方法的核心挑戰在於:低成本與高成本感測器的訊號難以實現幀級嚴格配對。硬體差異、取樣率不匹配及動態環境干擾導致監督資訊缺失,傳統生成式深度學習模型無法充分利用非配對資料內隱藏的監督資訊,因此易生成不滿足物理合理性的失真訊號。
現有研究多聚焦於訊號降噪(如卡爾曼濾波、經驗模態分解),但此類方法依賴先驗假設,泛化能力受限;而資料驅動方法雖能自適應學習,卻受限於配對資料的稀缺性。
針對上述問題,研究人員提出的HEROS-GAN(Honed-Energy Regularized and Optimal Supervised GAN),首次實現非配對資料監督下的加速度計訊號精度提升與量程擴充套件雙重目標,其核心創新包括:
  • 最優傳輸監督(Optimal Transport Supervision, OTS):基於最優傳輸理論,挖掘未配對訊號間的潛在特徵分佈一致性,構建柔性監督機制。透過最小化特徵遷移代價,實現跨域特徵對齊,突破傳統方法對嚴格配對資料的依賴。
  • 調製拉普拉斯能量(Modulated Laplace Energy, MLE):在生成器特徵層引入拉普拉斯能量自適應調控機制。透過微分幾何特徵動態調節生成訊號的高頻能量分佈,實現高動態場景下的量程突破與穩態噪聲抑制,實現量程擴充套件與噪聲抑制的雙重最佳化。
  • 本研究提出物理可解釋性評估體系(CSRE/ZVRE),它可以驗證生成訊號的物理合理性,首次為生成模型的可靠性與工程實用性建立嚴格的數學驗證框架,填補領域內生成訊號質量評估的理論空白。
最優傳輸監督
考慮到配對的低成本與高成本感測器訊號難以獲取,無法對生成模型施加逐元素匹配的端到端監督,文中提出基於最優傳輸理論的特徵對齊機制,透過挖掘非配對訊號特徵間的潛在關聯性實現跨域監督。
其核心思想在於:儘管兩類訊號未嚴格配對,但其深層特徵分佈因物理量測本質的一致性(如加速度的動力學約束、物理運動的時空連續性等)呈現潛在關聯性。
具體而言,最優傳輸理論透過量化特徵間的全域性遷移成本(如特徵相似度與分佈差異),動態構建低成本特徵向高成本特徵的最優對映關係。
這一過程不僅識別未配對資料中隱含的相似性模式(如動態響應特徵與噪聲分佈規律),更透過最小化全域性遷移代價實現特徵空間的柔性對齊。
基於此對映關係,研究人員設計最優傳輸監督可以引導生成器逐步修正特徵分佈偏差,使得低成本訊號特徵在保持物理合理性的前提下逼近高成本訊號特徵。
該機制突破傳統方法對嚴格配對資料的依賴,透過全域性分佈匹配而非逐點強制對映,在未配對資料下最大化利用跨域監督資訊,為生成模型的可靠性與泛化性提供了理論保障。
圖2 最優傳輸監督示意圖
調製拉普拉斯能量
針對傳統生成模型對訊號細節刻畫不足的問題,文中定義了深度學習特徵的拉普拉斯能量,並在生成器特徵層設計了一種拉普拉斯能量調製機制(Modulated Laplace Energy, MLE)。
該機制透過動態感知訊號局部曲率特徵,在高動態區間增強高頻分量以突破量程限制,在穩態區間抑制噪聲能量以提升信噪比,實現物理規律引導下的訊號細節重構。
該方法首次將微分幾何約束嵌入生成式模型,為物理資訊驅動的訊號增強提供了可擴充套件的演算法框架。
圖3 拉普拉斯能量調製機制流程圖
實驗
文中構建了首個包含10類智慧裝置的加速度計訊號增強資料集LASED,並提出物理可解釋性評估體系:CSRE/ZVRE。
在過載訊號重構任務中,該方法在15g量程下的重構誤差較傳統方法降低83.4%,零速度殘差(ZVRE)達到0.065m/s的物理一致性水平。
Allan方差分析表明,靜態噪聲中的量化噪聲降低94%,達到高階感測器實測效能。在實際工業場景測試中,成功捕捉到13.2g的機械衝擊峰值(傳統感測器在8.0g即飽和),並透過高精度三維高速運動捕捉裝置驗證了訊號波形的時頻域保真度。
結論
首先,OTS機制為跨域非配對資料建模提供了新的最佳化正規化,研究人員將其推廣至多模態醫療影像分析、跨平臺機器人感知等場景。
此外,MLE模組開創了微分運算元約束與生成式模型的融合路徑,為物理規律驅動的訊號重建提供了方法論指導。
文中構建的評估體系建立了演算法效能與物理可解釋性的定量關聯,為感測器訊號處理領域確立了新的評價標準。
工程層面,該技術已應用於工業機械臂振動監測系統,使成本$0.5以內感測器的測量精度達到$200專業裝置的水平,驗證了演算法落地應用的可行性。這項工作不僅突破了低成本感測器的效能極限,更啟示了生成式模型在物理資訊處理中的巨大潛力,為智慧感知領域的演算法-硬體協同創新提供了正規化參考。
作者介紹
王一峰,哈工大博士生,2023年受國家留學基金委資助,赴新加坡國立大學進行博士聯合培養,研究方向包括深度學習可解釋性分析、感測器訊號處理與分析、AI物理感知等。擔任國際生物資訊與生物醫學工程會議(BIBE)、計算機技術與資訊科學國際會議(CTIS)、機器人自動化與智慧控制國際會議(ICRAIC)分會主席,CVPR、ECCV、AAAI、Information Fusion、Pattern Recognition, Information Science等人工智慧頂級會議/期刊審稿人。
趙毅, 哈工大教授,應用數學研究中心主任和學科學術帶頭人,英國數學與應用學會會士,廣東省數學學會理事,廣東省工業與應用數學學會常務理事,研究方向包括應用動力系統、非線性時間序列分析、複雜網路和資料科學理論等。近五年以第一/通訊作者發表SCI論文59篇,其中3篇論文入選ESI高被引論文。
參考資料:
https://arxiv.org/abs/2502.18064

相關文章