CVPR2025知名影片分割挑戰賽啟動!

點選下方卡片,關注“CVer”公眾號

AI/CV重磅乾貨,第一時間送達

新增微訊號:CVer2233,小助手會拉你進群!
掃描下方二維碼,加入CVer學術星球可以獲得最新頂會/頂刊上的論文ideaCV從入門到精通資料,及最前沿應用!發論文/搞科研/漲薪,強烈推薦!

第四屆真實世界下的畫素級影片理解挑戰賽(The 4th PVUW challenge)
主頁/Call for Paper:
https://pvuw.github.io/
Workshop論文提交入口:
https://openreview.net/group?id=thecvf.com/CVPR/2025/Workshop/PVUW
賽道1:複雜場景影片目標分割挑戰賽(MOSE Challenge):
參賽、資料集下載:
https://codalab.lisn.upsaclay.fr/competitions/21948
賽道2:基於動作描述的指向性影片分割挑戰賽(MeViS Challenge):
參賽、資料集下載:
https://codalab.lisn.upsaclay.fr/competitions/21944
大賽簡介
第四屆 真實世界下的畫素級影片理解(Pixel-level Video Understanding in the Wild, PVUW)挑戰賽將於 CVPR 2025 期間在美國田納西州納什維爾的 Music City Center 舉辦。畫素級場景理解是計算機視覺中的核心問題之一,旨在識別影像中每個畫素的類別、掩碼和語義。然而,現實世界是動態的,基於影片的,而非靜態的影像狀態,因此學習進行影片分割對於實際應用來說更為合理和實用。為了推動從影像分割向影片分割的升級,本次 workshop 將釋出新的資料集和競賽,目標是在充滿挑戰但極具應用價值的開放世界場景下實現畫素級影片理解。
本次挑戰賽中設定了兩個賽道:複雜場景影片目標分割賽道(MOSE Track)和基於動作描述的指向性影片分割挑戰賽(MeViS Track)。在兩個挑戰賽中,主辦方採集了目前最大規模的複雜場景影片目標分割資料集Complex Video Object Segmentation (MOSE) [1] 和基於動作描述的影片分割Motion Expression Video Segmentation (MeViS) [2]。兩個資料集均針對兩個任務中亟需解決的問題,包含大量的高難度且貼近現實的樣本,對影片理解機器學習方法提出挑戰。
在挑戰賽的同時,本次workshop也將涵蓋以下研究主題,並歡迎相關論文投稿:
·影像/影片的語義與全景分割
·互動式影像/影片理解與分割(如基於文字、點選等)
·影片物件/例項分割   
·複雜環境下的影片理解
·語言引導的影片理解
·音訊引導的影片分割
·影片場景解析的高效計算方法
·影片中的半監督識別
·評估影片場景解析質量的新指標
·真實世界的影片應用(如自動駕駛、室內機器人、視覺導航等)
目前,兩個挑戰賽的資料集均已開放下載,測試提交入口也已開放,歡迎參賽者自由測試各種方法!
賽道1:複雜場景影片目標分割(MOSE)
MOSE(複雜場景影片目標分割)聚焦於複雜環境下的影片目標分割問題,旨在推動這一領域的研究與應用。本次大聚焦於配套的MOSE資料集 [1] 。該大規模資料集包含2149個影片片段和5200個目標,共有431,725個高質量的目標分割掩碼。影片解析度為1920×1080,影片長度從5秒到60秒不等。MOSE資料集的顯著特點是其複雜的場景,包括目標的消失和重現、不顯眼的小物體、嚴重的遮擋以及擁擠的環境等。相比於上一屆比賽,本屆比賽的測試資料中將會有全新場景加入,提供更加豐富、更加有挑戰性的資料。
資料集主頁:https://henghuiding.github.io/MOSE/
參賽網站:https://codalab.lisn.upsaclay.fr/competitions/21948
資料集下載:
https://codalab.lisn.upsaclay.fr/competitions/21948#participate
資料集api程式碼:https://github.com/henghuiding/MOSE-api
賽道2:基於動作描述的指向性影片分割(MeViS)
MeViS(基於動作描述的指向性影片分割)賽道也在CVPR2025上同期舉行。本次挑戰賽的重點是基於動作描述的指向性影片分割,即根據描述物體運動的句子來識別並分割影片內容中的目標物體。MeViS資料集 [2] 是此次比賽的重要組成部分,包含2006個影片片段和443,000個高質量的目標分割掩碼,共有28,570句描述8,171個複雜環境下物體運動的句子。在本屆賽事中,MeViS賽道也會加入更加有挑戰性的全新的場景和影片類別。
資料集主頁:https://henghuiding.github.io/MeViS/
參賽網站:https://codalab.lisn.upsaclay.fr/competitions/21944
資料集下載:
https://codalab.lisn.upsaclay.fr/competitions/21944#participate
Baseline 程式碼:https://github.com/henghuiding/MeViS
參賽資訊
兩個挑戰賽均在平臺CodaLab上舉辦。參賽者可以下載資料集至本地,訓練測試後將結果提交至賽事平臺進行評估。目前,兩個挑戰賽的資料集均已開放下載,驗證集提交入口也已開放,歡迎個人和團隊自由測試各種方法。
測試集提交入口開放時間為 3月15日至3月25日。最終比賽結果將於3月27日公佈,兩個挑戰賽的冠軍都將會被邀請在CVPR 2025 Workshop上分享展示。
Workshop論文提交入口也已經開放,歡迎各個領域的投稿!https://openreview.net/group?id=thecvf.com/CVPR/2025/Workshop/PVUW
[1] MOSE: A New Dataset for Video Object Segmentation in Complex Scenes. ICCV 2023   
[2] MeViS: A Large-scale Benchmark for Video Segmentation with Motion Expressions. ICCV 2023

何愷明在MIT授課的課件PPT下載


在CVer公眾號後臺回覆:何愷明,即可下載本課程的所有566頁課件PPT!趕緊學起來!

CVPR 2025 論文和程式碼下載


在CVer公眾號後臺回覆:CVPR2025,即可下載CVPR 2025論文和程式碼開源的論文合集

ECCV 2024 論文和程式碼下載


在CVer公眾號後臺回覆:ECCV2024,即可下載ECCV 2024論文和程式碼開源的論文合集
CV垂直方向和論文投稿交流群成立
掃描下方二維碼,或者新增微訊號:CVer2233,即可新增CVer小助手微信,便可申請加入CVer-垂直方向和論文投稿微信交流群。另外其他垂直方向已涵蓋:目標檢測、影像分割、目標跟蹤、人臉檢測&識別、OCR、姿態估計、超解析度、SLAM、醫療影像、Re-ID、GAN、NAS、深度估計、自動駕駛、強化學習、車道線檢測、模型剪枝&壓縮、去噪、去霧、去雨、風格遷移、遙感影像、行為識別、影片理解、影像融合、影像檢索、論文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。
一定要備註:研究方向+地點+學校/公司+暱稱(如Mamba、多模態學習或者論文投稿+上海+上交+卡卡),根據格式備註,可更快被透過且邀請進群

▲掃碼或加微訊號: CVer2233,進交流群
CVer計算機視覺(知識星球)來了!想要了解最新最快最好的CV/DL/AI論文速遞、優質實戰專案、AI行業前沿、從入門到精通學習教程等資料,歡迎掃描下方二維碼,加入CVer計算機視覺(知識星球),已彙集上萬人!

掃碼加入星球學習
▲點選上方卡片,關注CVer公眾號
整理不易,請點贊和在看


相關文章