點選下方卡片,關注“CVer”公眾號
AI/CV重磅乾貨,第一時間送達
點選進入—>【遙感】投稿交流群
AI/CV重磅乾貨,第一時間送達
點選進入—>【遙感】投稿交流群
新增微訊號:CVer2233,小助手會拉你進群!
掃描下方二維碼,加入CVer學術星球!可以獲得最新頂會/頂刊上的論文idea和CV從入門到精通資料,及最前沿應用!發論文/搞科研/漲薪,強烈推薦!
新增微訊號:CVer2233,小助手會拉你進群!
掃描下方二維碼,加入CVer學術星球!可以獲得最新頂會/頂刊上的論文idea和CV從入門到精通資料,及最前沿應用!發論文/搞科研/漲薪,強烈推薦!
論文:https://arxiv.org/pdf/2503.18803
專案:https://zhuduowang.github.io/Change3D
程式碼:https://github.com/zhuduowang/Change3D
單位:武漢大學, 香港大學, 字節跳動
核心創新點
◆三維時空建模範式
首個影片理解視角統一雙時相影像分析任務,透過Change3D框架實現時空特徵聯合建模,突破傳統二維方法的表徵侷限;
◆ 高效化動態感知
基於可學習感知幀實現高效特徵挖掘,摒棄複雜模組設計,僅透過時序建模即完成變化區域高精度提取;
◆ 多維度效能突破
在遙感影像變化檢測/描述等4類任務、8大評測基準中,以約6%-13%引數量(相較於當前最優演算法)實現全面性能領先。
研究背景
遙感變化檢測與描述技術透過分析雙時相影像實現地表動態監測,在災害預警、國土監管等領域具有重要價值。當前主流方案多采用三階段流程(如圖1 (a)):
◆獨立特徵編碼:基於孿生網路分別提取雙時相影像空間特徵;
◆差異特徵構建:透過注意力機制等設計捕捉雙時相特徵關聯性;
◆多工解碼:透過獨立解碼器生成變化圖或描述文字。

圖1 傳統正規化 vs. 本研究提出的正規化
技術瓶頸解析:
◆任務耦合性弱:獨立編碼器難以針對性學習變化敏感特徵,引數分配失衡(影像編碼器約佔用80%引數)導致特徵學習效率低下;
◆架構通用性差:變化檢測與描述任務需分別設計變化提取模組,制約統一框架構建。

圖2 不同模型的引數分佈對比
創新方案:
受影片建模技術能夠有效建模幀間關聯的啟發,本研究提出Change3D時空聯合建模框架(如圖1(b)):
◆時序特徵重構:將雙時相影像與可學習感知幀沿時間維度拼接,構建三維時空序列;
◆動態差異感知:透過影片編碼器聯合建模時空特徵,使感知幀自主捕獲跨時相變化資訊;
◆統一特徵解碼:基於感知幀特徵同步生成高精度變化圖與描述文字。
方法
為驗證Change3D框架的多工適配性,本研究將其應用於遙感影像變化檢測與描述任務。如圖3所示,其核心流程包括:
l感知幀初始化:根據任務數量(檢測/描述)動態生成對應數量的可學習感知幀;
l時空輸入構建:將雙時相影像與感知幀沿時間維度堆疊,形成三維影片幀序列輸入;
l感知特徵學習:透過影片編碼器實現感知幀與雙時相影像的跨幀互動,提取任務導向的感知特徵;
l多模態輸出解碼:基於感知幀特徵,分別透過檢測解碼器(生成變化掩膜)和描述解碼器(生成自然語言描述)輸出結果。

圖3 統一多工的Change3D模型架構
效能突破
定量結果:
本研究系統地評估了Change3D模型在多種遙感影像變化檢測和描述任務上的效能,如表1-4所示,涵蓋二值變化檢測、語義變化檢測、建築物損毀評估和變化描述任務。與最先進的方法相比,本研究提出的方法所需的引數減少至6%-13%,計算量減少至8%-34%,並且擁有最快的推理速度,同時在所有評測基準上均取得了優越的效能。




定性結果:
圖4視覺化結果表明:
(1)Change3D透過雙時相互動直接感知變化資訊,無需獨立提取模組,而傳統方法需依賴額外模組設計;
(2)相對於現有的方法,Change3D在特徵提取階段能夠有效地聚焦變化區域,實現變化檢測與描述任務的高效最佳化。

圖4 雙時相特徵

、

及變化特徵

的視覺化結果。
何愷明在MIT授課的課件PPT下載
何愷明在MIT授課的課件PPT下載
CVPR 2025 論文和程式碼下載
CVPR 2025 論文和程式碼下載
ECCV 2024 論文和程式碼下載
ECCV 2024 論文和程式碼下載
CV垂直方向和論文投稿交流群成立
一定要備註:研究方向+地點+學校/公司+暱稱(如Mamba、多模態學習或者論文投稿+上海+上交+卡卡),根據格式備註,可更快被透過且邀請進群
▲掃碼或加微訊號: CVer2233,進交流群
CVer計算機視覺(知識星球)來了!想要了解最新最快最好的CV/DL/AI論文速遞、優質實戰專案、AI行業前沿、從入門到精通學習教程等資料,歡迎掃描下方二維碼,加入CVer計算機視覺(知識星球),已彙集上萬人!
▲掃碼加入星球學習
▲點選上方卡片,關注CVer公眾號
整理不易,請點贊和在看

▲掃碼或加微訊號: CVer2233,進交流群
CVer計算機視覺(知識星球)來了!想要了解最新最快最好的CV/DL/AI論文速遞、優質實戰專案、AI行業前沿、從入門到精通學習教程等資料,歡迎掃描下方二維碼,加入CVer計算機視覺(知識星球),已彙集上萬人!

▲掃碼加入星球學習
▲點選上方卡片,關注CVer公眾號
整理不易,請點贊和在看
