「Medical Image Analysis」Note on 3D U-Net
QQ Group: 428014259
Sina Weibo:小鋒子Shawn
Tencent E-mail:[email protected]
http://blog.csdn.net/dgyuanshaofeng/article/details/83904176
作者:Ozgun Cicek, Ahmed Abdulkadir, Soeren S. Lienkamp, Thomas Brox, Olaf Ronneberger
單位:略
0 摘要
在半自動情形,使用者僅標註體資料中的某些片層,3D U-Net演算法可學習這些稀疏標註,然後輸出密集分割。屬於互動分割。
在全自動情形,同上,但是屬於自動分割。
採用elastic deformations進行高效資料擴充。
1 介紹
如圖1所示,為從稀疏標註中學習,並輸出密集分割的應用。
3D U-Net和2D U-Net類似,改動在於1、避免了bottlenecks,即 卷積(?);2、使用batchnorm加速收斂。
1.1 相關工作
2 網路結構
如圖2所示,為3D U-Net網路結構。
類似於2D U-Net,3D U-Net網路結構包含分析路徑和合成路徑,即編碼器和解碼器,共有4個水平或解析度。在分析路徑,每層包含2個 卷積,1個ReLU,1個步長為2的池化,顯然,最後一個水平沒有池化。在合成路徑,每層包含1個步長為2,卷積核大小為 上卷積(反捲積、轉置卷積、分數步長卷積),2個 卷積-ReLU組成的複合層。其中,3個水平使用了shortcut connections。最後,接輸出通道為3的 卷積,和加權softmax損失函式。共有引數19069955。在池化前,通道數進行doubling。在每一ReLU之前,使用BN。提及使用BN和batch size為1時,不使用global statistics,而使用current statistics。在加權softmax損失函式中,設定未標註體素的權重為0。因此,這很像體素級別的self-training技術。
3 執行細節
3.1 資料
Xenopus kidney embryos資料3套。利用Slicer3D對正交的xy,xz和yz片層進行手動標註。三軸均勻才有確定片層位置。0標籤為"inside the tubule",1標籤為"tubule",2標籤為"background",3標籤為"unlabeled"。每套資料僅標註了3個片層。
3.2 訓練
資料擴充採用旋轉、縮放和灰度值變換(gamma transformation?)和平滑密集deformation(B-spline interpolation)。加權方式為倒數中值頻率?標籤為3的體素,不貢獻損失。7萬次迭代,接近3天訓練時間,裝置為NVIDIA TianX。
4 實驗
4.1 半自動分割
稀疏標註的3套資料都用於網路訓練,然後對3套資料進行分割。如圖3所示,為第三套資料的分割結果。顯然,這很像體素級別的self-training,即學習標註體素,去分割未標註體素(網路前向過程),但是未標註體素的偽標籤,並未加入訓練。
[1] 3D U-Net Learning Dense Volumetric Segmentation from Sparse Annotation MICCAI 2016 [paper]