CVPR2025|清華&華科大提出INP-Former:超強異常檢測新方法!

點選下方卡片,關注“CVer”公眾號

AI/CV重磅乾貨,第一時間送達
五一最後一天福利!大家快掃碼下方二維碼,領取CVer知識星球最大優惠券:50元新使用者優惠券7折+20元老使用者續費券抓緊掃碼加入!每天分享最優質的AI工作(綜述/漲點神器/最新技術),最強助力你的科研!

轉載自:極市平臺

導讀

清華大學和華中科技大學的研究團隊提出一種新型異常檢測方法INP-Former,該方法透過從單張測試影像中動態提取內在正常原型(INPs),並利用這些INPs指導影像重建,透過重建誤差實現異常檢測,展現出卓越的效能和強大的泛化能力,為異常檢測領域帶來了新的突破。

工業檢測和醫療篩查等領域對異常檢測技術的需求日益增長,而現有方法通常依賴於將測試影像與訓練集中學習到的正常模式進行比較,這在面對外觀和位置變化時容易導致對齊問題,影響檢測準確性。
為解決這一難題,來自清華大學和華中科技大學的研究團隊提出了一種全新的方法 ——INP-Former,它能夠從單張測試影像中提取內在正常原型(INPs),並利用這些 INPs 指導影像重建,透過重建誤差實現異常檢測。這項研究由清華大學精密儀器系的羅威、姚海明、張效天和樓家楠,以及華中科技大學機械科學與工程學院的曹雲康、程育奇、沈衛明和余文勇等人共同完成。相關程式碼已開源,可供研究者進一步探索和應用。

論文標題:Exploring Intrinsic Normal Prototypes within a Single Image for Universal Anomaly Detection
論文地址:https://arxiv.org/pdf/2503.02424
專案地址:https://github.com/luow23

核心創新

  • 從單張影像提取 INPs:INP-Former 透過獨特設計的 INP 提取器,從測試影像本身動態提取與異常區域具有相同幾何上下文和外觀的正常區域作為 INPs,避免了傳統方法中因訓練集正常模式與測試影像不匹配導致的檢測誤差。
  • INP 指導的重建框架:引入 INP 指導解碼器,利用 INPs 重建正常模式,有效抑制異常特徵的重建,使重建誤差成為可靠的異常分數,提升檢測精度。
  • 損失函式最佳化:提出 INP 相干性損失,確保 INPs 準確代表正常特徵,避免捕獲異常資訊;同時引入軟挖掘損失,聚焦於難以最佳化的樣本,進一步提升模型效能。

效能表現

INP-Former 在多個數據集上進行了全面實驗,展現出卓越效能:
  • MVTec-AD 資料集:影像級指標達到 99.7/99.9/99.2,畫素級指標達到 98.5/71.0/69.7/94.9,顯著優於現有方法。
  • VisA 資料集:影像級指標達到 98.9/99.0/96.6,畫素級指標達到 98.9/51.2/54.7/94.4,取得最佳或第二佳成績。
  • Real-IAD 資料集:影像級指標達到 90.5/88.1/81.5,畫素級指標達到 99.0/47.5/50.3/95.0,重新整理了該資料集上的檢測記錄。

此外,INP-Former 在少樣本和單類別異常檢測任務中同樣表現出色,並展現出一定的零樣本檢測能力。

元件有效性驗證

我們首先驗證了INP-Former各個元件的有效性。透過在MVTec-AD和VisA資料集上的實驗,我們發現:
INP提取器和INP指導解碼器: 引入INP提取器和INP指導解碼器後,模型效能顯著提升。這是因為INP提取器能夠從測試影像中動態提取與異常區域具有相同幾何上下文和外觀的正常區域作為INPs,為後續的特徵重建提供了關鍵資訊。
INP相干性損失(Lc): Lc的加入進一步提升了模型效能。它確保提取的INPs能夠一致地表示正常模式,避免捕獲異常資訊,為異常特徵的抑制奠定了堅實基礎。
軟挖掘損失(Lsm):Lsm的引入使模型能夠更加關注難以最佳化的樣本,從而進一步提升整體效能。

INPs數量的影響

我們研究了不同數量的INPs(M)對模型效能的影響。實驗結果表明,當M超過4時,模型效能趨於穩定。然而,如果M過大,可能會引入異常資訊,導致效能略有下降。在我們的研究中,將M設定為6,既能保證效能,又能有效避免異常資訊的干擾。

方法優勢

  • 泛化能力強:INP-Former 從單張影像中提取 INPs 的能力使其具有強大的泛化能力,能夠適應不同類別和場景的異常檢測任務。
  • 計算效率高:透過提取簡潔的 INPs,INP-Former 有效降低了計算複雜度,適合實際應用中的高效檢測需求。
  • 魯棒性強:在面對複雜背景和多種異常型別時,INP-Former 能夠穩定地提取正常模式,提供可靠的檢測結果。

未來展望

INP-Former 的提出為異常檢測領域開闢了新方向。未來,研究團隊計劃進一步最佳化 INP 提取和利用方式,結合更多先驗知識和上下文資訊,提升模型對複雜異常模式的檢測能力,推動異常檢測技術在更多領域的廣泛應用。

五一最後一天福利!大家快掃碼下方二維碼,領取CVer知識星球最大優惠券:50元新使用者優惠券7折+20元老使用者續費券抓緊掃碼加入!每天分享最優質的AI工作(綜述/漲點神器/最新技術),最強助力你的科研!

何愷明在MIT授課的課件PPT下載
在CVer公眾號後臺回覆:何愷明,即可下載本課程的所有566頁課件PPT!趕緊學起來!

CVPR 2025 論文和程式碼下載

在CVer公眾號後臺回覆:CVPR2025,即可下載CVPR 2025論文和程式碼開源的論文合集

ECCV 2024 論文和程式碼下載

在CVer公眾號後臺回覆:ECCV2024,即可下載ECCV 2024論文和程式碼開源的論文合集
CV垂直方向和論文投稿交流群成立
掃描下方二維碼,或者新增微訊號:CVer2233,即可新增CVer小助手微信,便可申請加入CVer-垂直方向和論文投稿微信交流群。另外其他垂直方向已涵蓋:目標檢測、影像分割、目標跟蹤、人臉檢測&識別、OCR、姿態估計、超解析度、SLAM、醫療影像、Re-ID、GAN、NAS、深度估計、自動駕駛、強化學習、車道線檢測、模型剪枝&壓縮、去噪、去霧、去雨、風格遷移、遙感影像、行為識別、影片理解、影像融合、影像檢索、論文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。
一定要備註:研究方向+地點+學校/公司+暱稱(如Mamba、多模態學習或者論文投稿+上海+上交+卡卡),根據格式備註,可更快被透過且邀請進群

▲掃碼或加微訊號: CVer2233,進交流群
CVer計算機視覺(知識星球)人數破萬!如果你想要了解最新最快最好的CV/DL/AI論文、實戰專案、行業前沿、從入門到精通學習教程等資料,一定要掃描下方二維碼,加入CVer知識星球!最強助力你的科研和工作!

掃碼加入星球學習
▲點選上方卡片,關注CVer公眾號
整理不易,請點贊和在看


相關文章