點選下方卡片,關注“CVer”公眾號
AI/CV重磅乾貨,第一時間送達
新增微訊號:CVer2233,小助手會拉你進群!
掃描下方二維碼,加入CVer學術星球!可以獲得最新頂會/頂刊上的論文idea和CV從入門到精通資料,及最前沿應用!發論文/搞科研/漲薪,強烈推薦!
轉載自:將門創投
擴散模型作為一種強大的生成模型,已在影像重建任務中展現出巨大潛力。其基本原理是在訓練階段最佳化噪聲估計網路(如UNet),並透過去噪和加噪過程完成影像生成。然而,如何提升擴散模型在影像重建中的效能與效率,仍是一個重要挑戰。
在影像重建任務中,擴散模型面臨兩個主要問題:首先,噪聲估計任務與影像重建任務之間存在偏差,限制了重建效果;其次,推理過程需要大量迭代步驟,導致速度慢、效率低。為解決這些問題,本文提出了可逆擴散模型(IDM),透過引入端到端訓練框架和可逆網路設計,顯著提升了影像重建的效能和效率。
點選下方卡片,關注“CVer”公眾號
點選下方卡片,關注“CVer”公眾號
AI/CV重磅乾貨,第一時間送達
AI/CV重磅乾貨,第一時間送達
新增微訊號:CVer2233,小助手會拉你進群!
掃描下方二維碼,加入CVer學術星球!可以獲得最新頂會/頂刊上的論文idea和CV從入門到精通資料,及最前沿應用!發論文/搞科研/漲薪,強烈推薦!
新增微訊號:CVer2233,小助手會拉你進群!
掃描下方二維碼,加入CVer學術星球!可以獲得最新頂會/頂刊上的論文idea和CV從入門到精通資料,及最前沿應用!發論文/搞科研/漲薪,強烈推薦!

擴散模型作為一種強大的生成模型,已在影像重建任務中展現出巨大潛力。其基本原理是在訓練階段最佳化噪聲估計網路(如UNet),並透過去噪和加噪過程完成影像生成。然而,如何提升擴散模型在影像重建中的效能與效率,仍是一個重要挑戰。

論文標題:Invertible Diffusion Models for Compressed Sensing論文連結:https://arxiv.org/abs/2403.17006開原始碼:https://github.com/Guaishou74851/IDM
一、任務背景
擴散模型作為當前非常知名且強大的生成模型之一,已在影像重建任務中展現出極大的潛力。擴散模型的基本實現方式是在訓練階段構建一個噪聲估計網路(通常是一個UNet),並在推理階段透過迭代的去噪和加噪過程完成影像生成與重建。然而,如何進一步提升擴散模型在影像重建中的效能與效率,仍然是業界探索的重點問題。
當我們將擴散模型應用於影像重建任務時,面臨兩個關鍵挑戰:
-
挑戰一:“噪聲估計”任務與“影像重建”任務之間的偏差。 擴散模型中的深度神經網路主要針對“噪聲估計”任務(即,從當前變數中估計出噪聲)得到最最佳化,而非“影像重建”任務(即,從低質量的觀測資料中預測原始影像)本身。這可能導致其影像重建效能存在進一步提升的空間。
-
挑戰二:推理速度慢、效率低。 儘管擴散模型能夠生成較為真實的影像,但其推理過程往往需要大量的迭代步驟,執行時間長,計算開銷大,不利於實際應用。
針對這兩個挑戰,本文提出了一種可逆擴散模型(Invertible Diffusion Models,IDM)。這一方法透過引入(1)端到端的訓練框架與(2)可逆網路設計,有效提升了影像重建的效能與效率。
二、主要貢獻
我們的方法在影像重建任務中帶來了兩個主要創新:
2.1 端到端的擴散取樣影像重建學習框架

2.2 雙層可逆網路設計:減少記憶體開銷
在實踐中,我們將可逆網路應用到(1)所有擴散取樣步驟和(2)噪聲估計網路的內部,透過“佈線”技術將每個取樣步驟與其前後模組連線,形成一個雙層可逆網路。這一設計使得整個訓練過程中,程式無需儲存完整的特徵圖資料,只需儲存較少的中間變數,顯著降低了訓練模型的GPU記憶體需求。最終,這使得我們可以在視訊記憶體有限的GPU(如1080Ti)上對該模型進行端到端訓練。

三、實驗結果
3.1 影像壓縮感知重建


3.2 影像補全與醫學成像

3.3 計算成本與推理時間的最佳化

何愷明在MIT授課的課件PPT下載
何愷明在MIT授課的課件PPT下載
CVPR 2025 論文和程式碼下載
CVPR 2025 論文和程式碼下載
ECCV 2024 論文和程式碼下載
ECCV 2024 論文和程式碼下載
CV垂直方向和論文投稿交流群成立
一定要備註:研究方向+地點+學校/公司+暱稱(如Mamba、多模態學習或者論文投稿+上海+上交+卡卡),根據格式備註,可更快被透過且邀請進群
▲掃碼或加微訊號: CVer2233,進交流群
CVer計算機視覺(知識星球)來了!想要了解最新最快最好的CV/DL/AI論文速遞、優質實戰專案、AI行業前沿、從入門到精通學習教程等資料,歡迎掃描下方二維碼,加入CVer計算機視覺(知識星球),已彙集上萬人!
▲掃碼加入星球學習
▲點選上方卡片,關注CVer公眾號
整理不易,請點贊和在看

▲掃碼或加微訊號: CVer2233,進交流群
CVer計算機視覺(知識星球)來了!想要了解最新最快最好的CV/DL/AI論文速遞、優質實戰專案、AI行業前沿、從入門到精通學習教程等資料,歡迎掃描下方二維碼,加入CVer計算機視覺(知識星球),已彙集上萬人!

▲掃碼加入星球學習
▲點選上方卡片,關注CVer公眾號
整理不易,請點贊和在看
