實驗室4篇論文被ICCV2025錄用

點選下方卡片,關注“CVer”公眾號

AI/CV重磅乾貨,第一時間送達

新增微訊號:CVer2233,小助手會拉你進群!
掃描下方二維碼,加入CVer學術星球可以獲得最新頂會/頂刊上的論文idea入門到精通資料,及最前沿應用!發論文/搞科研/漲薪,強烈推薦!

來源:浙江工業大學計算機科學與技術學院
近日,我院4項研究成果被中國計算機學會(CCF)推薦的A類國際頂級學術會議ICCV 2025錄用。ICCV 2025 將於10月19日至25日在美國夏威夷舉辦,今年共收到11239份有效投稿,程式委員會推薦錄用2699篇論文,最終錄用率為24%。
成果一
Transformer-based Tooth Alignment Prediction with Occlusion and Collision Constraints
作者:董振興,陳佳舟
該論文屬於AI醫療領域的交叉研究成果,提出了一種考慮了咬合與碰撞等醫學約束的牙齒正畸目標位預測方法,該方法將三維牙齒點雲重構為多通道二維影像,並巧妙地結合了Swin-transformer神經網路,從而提高了預測的精度和效率。該工作還聯合產學研合作企業花費2年多的時間收集並整理了855份珍貴的正畸樣本資料,並利用計算機圖形學技術高保真地增強資料集,彌補了該領域缺乏資料集的不足。
成果二
SMSTracker: Tri-path Score Mask Sigma Fusion for Multi-Modal Tracking
作者:產思賢,勵澤棟,張笑欽,李文浩,呂士健,沈春華
該論文聚焦於計算機視覺領域中的多模態目標跟蹤任務,提出了一種名為SMSTracker的創新性三通路打分掩碼Sigma融合框架。該方法透過設計三通路打分融合模組評估各模態特徵的可靠性,最佳化互補特徵的利用;引入先驅性的Sgima互動模組實現三通路特徵的深度融合與共享,提升特徵互動效果;並提出Drop Key Fine-tuning策略,解決多模態學習中資料貢獻不均的問題,增強模型對多模態資訊的綜合處理能力,為多模態目標跟蹤提供了新的有效解決方案。
成果三
Laboring on less labors: RPCA Paradigm for Pan-sharpening
作者:徐宏輝,鄭建煒
該論文聚焦於遙感影像的空間-光譜融合任務,提出了一種名為RUN的魯棒主成分分析(PRCA)展開網路。基於遙感影像空間偏移殘差的稀疏性,該方法將原始融合問題轉化為基於RPCA的結構化去噪問題,並將傳統雙退化建模簡化為單退化建模,避免了對複雜空間退化矩陣的顯式估計;提出了基於非線性變換的張量核範數模組,以深度可分離卷積替代高開銷的奇異值分解;並靈活嵌入至Transformer以及CNN框架中以提升特徵學習效果,拓展了遙感影像融合任務的建模思路。
成果四
Unified Open-World Segmentation with Multi-Modal Prompts
作者:劉陽,尹宇飛,景宸琛,朱慕之,陳昊,席玉玲,馮博,王昊,李石羽,沈春華
該論文提出了一種統一的開放世界分割模型COSINE,融合了多模態提示(如文字與影像)驅動的開放詞彙分割與上下文分割任務。COSINE充分利用基礎模型提取影像與多模態提示的表徵資訊,並透過SegDecoder對齊不同模態表徵、建模其互動關係,從而實現多粒度的目標掩碼生成。該方法有效統一了以往開放詞彙分割與上下文分割在架構設計、學習目標和表徵方式上的差異。大量實驗證明COSINE在兩類任務中均取得顯著效能提升,進一步的分析則表明了視覺與文字提示的協同融合顯著增強了模型的泛化能力,優於單模態方法。

何愷明在MIT授課的課件PPT下載
在CVer公眾號後臺回覆:何愷明,即可下載本課程的所有566頁課件PPT!趕緊學起來!

ICCV 2025 論文和程式碼下載

在CVer公眾號後臺回覆:ICCV2025,即可下載ICCV 2025論文和程式碼開源的論文合

CVPR 2025 論文和程式碼下載

在CVer公眾號後臺回覆:CVPR2025,即可下載CVPR 2025論文和程式碼開源的論文合集
CV垂直方向和論文投稿交流群成立
掃描下方二維碼,或者新增微訊號:CVer2233,即可新增CVer小助手微信,便可申請加入CVer-垂直方向和論文投稿微信交流群。另外其他垂直方向已涵蓋:目標檢測、影像分割、目標跟蹤、人臉檢測&識別、OCR、姿態估計、超解析度、SLAM、醫療影像、Re-ID、GAN、NAS、深度估計、自動駕駛、強化學習、車道線檢測、模型剪枝&壓縮、去噪、去霧、去雨、風格遷移、遙感影像、行為識別、影片理解、影像融合、影像檢索、論文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。
一定要備註:研究方向+地點+學校/公司+暱稱(如Mamba、多模態學習或者論文投稿+上海+上交+卡卡),根據格式備註,可更快被透過且邀請進群

▲掃碼或加微訊號: CVer2233,進交流群
CVer計算機視覺(知識星球)人數破萬!如果你想要了解最新最快最好的CV/DL/AI論文、實戰專案、行業前沿、從入門到精通學習教程等資料,一定要掃描下方二維碼,加入CVer知識星球!最強助力你的科研和工作!

掃碼加入星球學習
▲點選上方卡片,關注CVer公眾號
整理不易,請點贊和在看


相關文章