首個3D全腹部病灶多類分割資料集!上海AI實驗室與利物浦大學推出MSWAL

首個3D全腹部病灶多類分割資料集!上海AI實驗室與利物浦大學聯合推出MSWAL:3D Multi-class Segmentation of Whole Abdominal Lesions Dataset
MSWAL: 3D Multi-class Segmentation of Whole Abdominal Lesions Dataset
論文: https://arxiv.org/pdf/2503.13560

研究動機

當前現有的醫療腹部病灶分割資料集存在一些侷限性。大多數資料集要麼只侷限於一個器官的病灶,導致輔助診斷時可能漏掉其他器官的病灶;要麼在融合資料集時存在漏標,且把所有病灶歸為一類,導致模型訓練時存在大量的噪聲;要麼病灶的種類不夠多,一些重要的常見病灶因此被忽略。基於這些訓練的模型都在輔助診斷中有一定的限制性。MSWAL的研究動機正是為了填補這些空白。透過提出MSWAL,我們旨在以全腹部病灶分割資料集為基準,為後續的分割演算法提供基礎,以訓練更為強大的能夠覆蓋全腹部的病灶分割的演算法。

亮點

1. 首個3D全腹部病灶多類分割資料集:我們提出了MSWAL,為後續的腹部病灶分割演算法提供了訓練的基準。
2. 遷移學習實驗:我們進行了遷移學習實驗,實驗結果表明在MSWAL資料集預訓練後,且LiTS和KiTS微調後,精度有明顯的提升,特別是在病灶上的精度提升更為明顯。
3. Inception nnU-Net:我們創新性地提出了Inception nnU-Net,利用nnU-Net框架的預處理能力和Mini Inception的多感受野,提取了不同病灶的特徵,實驗表明,Inception nnU-Net相較於六個公開的SOTA模型相比,具有更好的效能。
4. Benchmark:我們建立了一個新的基於MSWAL的benchmark,評估了六個公開的SOTA模型的效能。

MSWAL資料集的特點:

1. 七種病灶分割:MSWAL包括七種病灶的分割,包括膽囊結石(215例),腎結石(415例),肝腫瘤(767例),腎腫瘤(240例),胰腺癌(117例),肝囊腫(2287例),腎囊腫(1171例)。
2. 標註出了具體病灶種類:MSWAL給每種病灶不同的標籤,而不是其他資料集一樣的泛腫瘤類別。3. 全標註:不像其他融合資料集存在漏標的情況,MSWAL的每一個病灶都被標註出來。

資料獲取方式

資料來自於單中心。為了保證資料的標註質量,所有資料被一名臨床經驗超過十年的主治醫師標註,然後,由一名臨床經驗超過二十年的主任醫師稽核資料。標註和稽核的總時間線超過11個月。

統計資訊

MSWAL包括694個CT體積(191417張切片)。每個CT體積包括52到1089張切片,每張切片均為512 x 512畫素點。在訓練和測試集的劃分上,我們大致按照7:3將資料集劃分為了484個訓練集和210個測試集。在男女比例上,53.9%的資料(374)為男性,46.1%的資料(320)為女性。資料包含多個掃描期相,平掃期,動脈期,靜脈期,門延期和延遲期。

Inception nnU-Net

除提出MSWAL之外,我們創新性地提出了Inception nnU-Net,該模型由兩大核心模組組成,Mini Inception和Inception Downsampling,我們的實驗表明,Inception nnU-Net在MSWAL上面獲得了SOTA效果。如圖所示:
對比實驗的結果展示出腎臟部位的病灶是最難識別的,原因可能是腎臟部位的病灶包括腎腫瘤,腎囊腫,腎結石,這三種病灶之間的特徵相似性會一定程度地干擾模型的判斷。此外樣本的不均衡也成為了一個比較嚴重的挑戰。以腎臟病灶為例,腎囊腫有1171例,腎結石有415例,腎腫瘤有240例,這種長尾型的分佈進一步增加了任務的難度。
消融實驗的結果進一步證明了兩大模組的重要性:
我們可視化了一些Inception nnU-Net和其他公開SOTA模型在MSWAL上的表現,進一步證明了Inception nnU-Net的效果:

遷移學習實驗

模型在大量的高質量資料集預訓練後,在子任務上的變現會更好。為了驗證MSWAL資料集的高質量和泛化性,我們進行了遷移學習的實驗。實驗表明,在MSWAl預訓練並在LiTS和KiTS微調後,儘管對於器官的分割效果沒有大的提升,對於病灶的分割效果是提升非常明顯的。

何愷明在MIT授課的課件PPT下載

在CVer公眾號後臺回覆:何愷明,即可下載本課程的所有566頁課件PPT!趕緊學起來!

CVPR 2025 論文和程式碼下載

在CVer公眾號後臺回覆:CVPR2025,即可下載CVPR 2025論文和程式碼開源的論文合集

ECCV 2024 論文和程式碼下載

在CVer公眾號後臺回覆:ECCV2024,即可下載ECCV 2024論文和程式碼開源的論文合集
醫學影像和論文投稿交流群成立
掃描下方二維碼,或者新增微訊號:CVer2233,即可新增CVer小助手微信,便可申請加入CVer-醫學影像和論文投稿微信交流群。另外其他垂直方向已涵蓋:目標檢測、影像分割、目標跟蹤、人臉檢測&識別、OCR、姿態估計、超解析度、SLAM、醫療影像、Re-ID、GAN、NAS、深度估計、自動駕駛、強化學習、車道線檢測、模型剪枝&壓縮、去噪、去霧、去雨、風格遷移、遙感影像、行為識別、影片理解、影像融合、影像檢索、論文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。
一定要備註:研究方向+地點+學校/公司+暱稱(如醫學影像分割或者論文投稿+上海+上交+卡卡),根據格式備註,可更快被透過且邀請進群

▲掃碼或加微訊號: CVer2233,進交流群
CVer計算機視覺(知識星球)來了!想要了解最新最快最好的CV/DL/AI論文速遞、優質實戰專案、AI行業前沿、從入門到精通學習教程等資料,歡迎掃描下方二維碼,加入CVer計算機視覺(知識星球),已彙集上萬人!

掃碼加入星球學習
▲點選上方卡片,關注CVer公眾號
整理不易,請點贊和在看


相關文章