點選下方卡片,關注“CVer”公眾號
點選下方卡片,關注“CVer”公眾號
AI/CV重磅乾貨,第一時間送達
AI/CV重磅乾貨,第一時間送達
新增微訊號:CVer2233,小助手會拉你進群!
掃描下方二維碼,加入CVer學術星球!可以獲得最新頂會/頂刊上的論文idea和CV從入門到精通資料,及最前沿應用!發論文/搞科研/漲薪,強烈推薦!
新增微訊號:CVer2233,小助手會拉你進群!
掃描下方二維碼,加入CVer學術星球!可以獲得最新頂會/頂刊上的論文idea和CV從入門到精通資料,及最前沿應用!發論文/搞科研/漲薪,強烈推薦!

HVI: A New Color Space for Low-light Image Enhancement
作者:Qingsen Yan, Yixu Feng, Cheng Zhang, Guansong Pang, Kangbiao Shi, Peng Wu, Wei Dong, Jinqiu Sun, Yanning Zhang
論文:https://arxiv.org/abs/2502.20272
程式碼:https://github.com/Fediory/HVI-CIDNet
Hugging Face Demo:
https://huggingface.co/spaces/Fediory/HVI-CIDNet_Low-light-Image-Enhancement_

目前,所有的程式碼,演算法,訓練權重,基於11個數據集(LOLv1, LOLv2-real, LOLv2-synthetic, , DICM, LIME, NPE, MEF, VV, Sony-Total-Dark, SICE, LOL-Blur)的測試結果,均已開源。模型的demo也可以在hugging face網站上免費體驗到,歡迎大家來使用我們的HVI-CIDNet方法。下面我們對我們的論文進行詳細的介紹。
1. 關鍵動機
低光影像增強(LLIE)旨在提升暗光環境下捕獲影像的視覺質量,同時抑制噪聲和顏色失真。
傳統的影像增強方法大多基於常見的sRGB色彩空間,但其有個致命缺點——顏色和亮度高度耦合,增強時易引發色偏和亮度偽影。
後來,研究者改用HSV色彩空間(把顏色解耦為為色調、飽和度和亮度),雖然取得了一些進展,但增強效果始終不理想,會導致紅色與黑暗區域產生嚴重偽影。我們認為是HSV中有兩種特殊的噪點導致了這個問題(如圖1b):
(1)紅色間斷噪點:在HSV中,紅色色調(Hue)在色環的兩端(0°和360°)是同一個顏色,但演算法處理時容易割裂,導致噪點。
(2)黑色平面噪點:低光區域的畫素亮度極低,而HSV的變換過度放大這些黑暗區域,把噪聲也過度放大,導致信噪比極低。

圖1. sRGB->HSV->HVI的顏色空間變換過程與動機。
為了解決這兩種噪聲,我們基於HSV,設計了一個HVI色彩空間。只需簡單兩步就可以解決這個問題:
(1)極座標化HS平面,讓相鄰的紅色區域在數學上更連續,徹底消除斷裂式噪點(見圖1c),確保顏色空間內相似色彩的歐氏距離最小化,提高紅色區域內的信噪比。
(2)HVI引入了一個可學習的光強壓縮函式(Ck),動態壓縮低光區域強度,抑制噪聲,同時保留高光細節,維持色彩空間級別的更高信噪比(見圖1d)。
基於HVI的特性,我們進一步設計雙分支解耦網路CIDNet來作為一個新的低光增強基準線方法。具體來說,它由下面三個核心構成:
HV分支:建模顏色不變性,分離噪聲與真實紋理;
I分支:學習光照分佈的物理約束,實現自適應亮度增強;
交叉注意力機制:透過跨分支特徵互動,聯合最佳化噪聲抑制與光照恢復過程。
實驗表明,HVI-CIDNet在10+1個基準資料集(外加一個LOL-Blur聯合任務資料集)上均達到SOTA效能。例如,在極端暗光資料集Sony-Total-Dark上,PSNR相比最優基線提升6.68 dB,且模型引數量僅1.88M,計算量7.57 GFLOPs,顯著優於現有方法。
2. HVI顏色空間變換
接下來,我將們介紹如何基於一張sRGB格式的影像,對其進行HVI正變換(sRGB->HVI)。
第一步:根據Max-RGB理論,計算每個畫素的強度(Intensity)通道,構建I-Map:

第二步:利用I-Map中畫素的值,來得到HSV中的色相(Hue)和飽和度(Saturation):


如此,你可以發現在HSV空間中,紅色在色相端點(h=0和h=6)上間斷(數學不連續性),進而導致增強後出現紅色斷裂式噪聲。因此我們只需要將h對映到兩個新的正交分量H和V上即可解決這個問題:

第三步:因為HSV低光區域的顏色空間級別噪聲被過度放大,因此我們需要一個坍縮函式來保持相近的顏色具有更近的歐式距離。因此,我們設計了光強壓縮函式(Ck):

其中,k為一個可學習的引數控制低光區域的壓縮強度;ε=10^-8避免梯度爆炸。
第四步:最終,我們將剛才的光強壓縮函式,飽和度(S-Map),與I-Map逐元素相乘,得到兩個最終的正交軸(HV)。將HV與I-Map按通道連線後,即可得到sRGB格式影像的HVI-Map。

3. 雙分支解耦網路CIDNet

圖2. HVI-CIDNet增強流程
CIDNet是為HVI色彩空間量身定製的雙分支低光增強網路,旨在透過解耦建模顏色(HV通道)與亮度(I通道)資訊,實現精準的噪聲抑制與光照恢復。CIDNet基於編碼器-解碼器結構,包含三個下采樣和三個上取樣層,每層都嵌入了一個輕量化交叉注意力模組(LCA)。
將低光影像變換到HVI顏色空間後,將光強圖輸入至I分支,建模光照分佈的物理約束,自適應增強全域性與區域性亮度,避免過曝/欠曝;將HVI圖輸入至HV分支,學習顏色不變性特徵,分離噪聲與真實紋理,抑制色偏與區域性偽影。
LCA的作用:
HV → I:HV分支提供噪聲分佈先驗,指導I分支在低光區域抑制過增強;
I → HV:I分支提供光照強度權重,引導HV分支在暗區加強去噪,亮區保留細節。
最後將增強後的HV圖和I圖按通道連線後,輸入至HVI逆變換模組中(PHVIT),即可得到增亮後的sRGB影像。HVI逆變換和訓練時損失函式詳見論文。
4. 實驗結果

表1 LOL基準測試結果

表2 CIDNet在DICM, LIME, NPE, MEF, VV, Sony-Total-Dark, SICE資料集上的結果

圖3. LOL視覺效果對比

圖4. 五個非配對資料集上的定性實驗結果對比
基準實驗:首先是在十個資料集(LOLv1, LOLv2-real, LOLv2-synthetic, DICM, LIME, NPE, MEF, VV, Sony-Total-Dark, SICE)上的定量實驗。如表1和表2,在LOL資料集上,CIDNet的PSNR/SSIM/LPIPS全面超越SOTA方法(如RetinexFormer、GSAD),且保持7.57GFLOPs的較低運算量。在Sony-Total-Dark和SICE這兩個大型資料集上也取得了最佳的指標。尤其是Sony-Total-Dark,PSNR 22.90 dB(比第二名提升6.68 dB)。視覺對比
雖然CIDNet在五個非配對資料集上(DICM, LIME, NPE, MEF, VV)的BRISQUE指標不如RetinexNet方法,但是卻比它更接近真實世界(如圖4)。

表3 HVI顏色空間在其它方法中的相容性對比
跨方法相容性:如表3,將HVI變換作為預處理模組應用於其他LLIE方法(如FourLIE、GSAD)後,平均PSNR提升1.2~3.5dB,且GSAD方法結合HVI後,SSIM與LPIPS均達到最佳效果。

表4 針對不同模組進行的消融實驗

圖5. 顏色空間消融實驗

圖6. CIDNet模組消融實驗
如表4,圖5,和圖6,消融實驗表明,我們所提出的光強壓縮函式,HS極座標化,和CIDNet的子模組均有效,獲得了很好的定性與定量實驗結果。

圖7. LOL-Blur視覺對比

表5 LOL-Blur基準測試結果
附加:如圖7和表5,在聯合低光影像增強和去模糊LOL-Blur資料集上也取得了最先進的結果。
何愷明在MIT授課的課件PPT下載
何愷明在MIT授課的課件PPT下載
CVPR 2025 論文和程式碼下載
CVPR 2025 論文和程式碼下載
ECCV 2024 論文和程式碼下載
ECCV 2024 論文和程式碼下載
CV垂直方向和論文投稿交流群成立
一定要備註:研究方向+地點+學校/公司+暱稱(如Mamba、多模態學習或者論文投稿+上海+上交+卡卡),根據格式備註,可更快被透過且邀請進群
▲掃碼或加微訊號: CVer2233,進交流群
CVer計算機視覺(知識星球)來了!想要了解最新最快最好的CV/DL/AI論文速遞、優質實戰專案、AI行業前沿、從入門到精通學習教程等資料,歡迎掃描下方二維碼,加入CVer計算機視覺(知識星球),已彙集上萬人!
▲掃碼加入星球學習
▲點選上方卡片,關注CVer公眾號
整理不易,請贊和在看

▲掃碼或加微訊號: CVer2233,進交流群
CVer計算機視覺(知識星球)來了!想要了解最新最快最好的CV/DL/AI論文速遞、優質實戰專案、AI行業前沿、從入門到精通學習教程等資料,歡迎掃描下方二維碼,加入CVer計算機視覺(知識星球),已彙集上萬人!

▲掃碼加入星球學習
▲點選上方卡片,關注CVer公眾號
整理不易,請贊和在看
