1. 程式人生 > >醫學影象 | DualGAN與兒科超聲心動圖分割 | MICCAI

醫學影象 | DualGAN與兒科超聲心動圖分割 | MICCAI

- 文章轉自微信公眾號:「機器學習煉丹術」 - 作者:煉丹兄(已授權) - 聯絡方式:微信cyx645016617(歡迎交流共同進步) - 論文名稱:“Dual Network Generative Adversarial Networks for Pediatric Echocardiography Segmentation” ## 0 準備工作 ### 0.1 生詞 - Pediatric 兒童的 - Pediatric echocardiography 小兒超聲心動圖 - CHD : congenital heart disease 先天心臟病 ### 0.2 ## 1 綜述 為了獲得高質量的分割結果,目前臨床上小兒超聲心動圖的分割主要由超聲工作者手工完成,這既費時費力,又高度依賴於超聲工作者的專業水平。為了解決這些問題,本文提出了一種新的卷積神經網路(CNN)結構,稱為雙網路一般對抗網路(DNGAN)。DNGAN由一個產生器和兩個鑑別器組成,產生器採用並行對偶網路來提取更多有用的特徵以提高效能。我們使用雙重鑑別器來強制生成器學習更多的空間特徵,並更準確地分割左心的邊緣。 ## 2 問題提出 ![在這裡插入圖片描述](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/28b3f88a826c48749ac55c43c19226f2~tplv-k3u1fbpfcp-zoom-1.image) 圖中是兒童的心臟的左心室和左心房的分割標註label,可以發現:**左心房的變化比較明顯,並且內壁會存在模糊**,因此目前的對於四腔的分割存在一下挑戰: (1)因為噪音和模糊出現的邊界不清晰; (2)心臟的尺寸對於不同人是不同的; (3)每一個心動週期心房和心室的變化是不同的。 ## 3 模型結構 ![在這裡插入圖片描述](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/1ed60e564dc7412e84307143699aecdb~tplv-k3u1fbpfcp-zoom-1.image) 這個DNGAN的結構如上所示:包含一個生成器和兩個鑑別器。 ### 3.1 generator 由一個U-net和FCN並行構成,分別從輸入圖片中提取兩種特徵,然後特徵進行畫素相乘. FCN輸出的特徵圖為$f_1$,U-net輸出的特徵圖為$f_2$,那麼由generator輸出的影象分割結果為$F_G = f_1 \times f_2$. ### 3.2 discriminator 是一個六層的全卷積網路,然後分別用7,5,3作為卷積核的大小。卷積層後面跟著BN層和LeakReLU啟用層。 使用的是multi-scale L1損失,類似於2014年的影象分割網路Richer conv net。 ## 4 損失 ### 4.1 generator損失 先回顧一下一般的GAN的損失函式: ![在這裡插入圖片描述](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/c80e7bac8c9140e5b71b1632385c7cc7~tplv-k3u1fbpfcp-zoom-1.image) 在公式中: - x是real image - z是random import for generator - G(z)是生成的mask - D(x) 是判別起判斷x是true的概率 再來看一下DNGAN的損失函式: ![在這裡插入圖片描述](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/f75d4f23426d4ac2982cdfb3d9c2595d~tplv-k3u1fbpfcp-zoom-1.image) - N為樣本的數量; - $x_n$為某一張兒童超聲心動圖四腔圖,$y_n$為對應的ground truth; - $l_m$是mean absolute error,也就是我們說的L1loss; ![在這裡插入圖片描述](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/ad972b2bd5d141db90b7f9008699186c~tplv-k3u1fbpfcp-zoom-1.image) 這個可以看到,$f_D(x)$是discrimintor提取的特徵,L表示discrimintor的層數,所以$f_D^i(x)$表示discrimintor第i層提取出來的特徵圖 - $l_{cos}$就是常說的cross entropy; - $l_{D_2}$是第二個discriminitor的損失函式,也比較複雜我們來看一下,這個損失函式分辨的是:**輸入的是生成的mask還是真實的mask**。 ## 5 資料描述 - 資料集包含87個兒童超聲心動圖; - 蒐集的是0到10歲的健康的兒童,每個視訊至少包含24幀和一個完成的心動週期; - 隨機選擇67個視訊,抽取了1765個圖片作為訓練集;剩下20個視訊抽取451個視訊作為測試集; - 原始圖片的解析度是1016x708或者636x432,所有的圖片經過中心crop後變成704x704和448x448; ## 6 總結 1, 這篇文章的結果和過程存在疑點,文章中出現一處公式的疑似符號錯誤。 ![在這裡插入圖片描述](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/1e7c185b4be84fdea27c42a4f3d8a05d~tplv-k3u1fbpfcp-zoom-1.image) 2, 文章中的並沒有給出第二個discrimintor的loss使用MSE和BCE的平均值的原因,不確定是否之前就有文章已經討論過這個樣做的優勢。從結果來看,使用GAN的框架來訓練造成的提升並不高,反而提升分割精度的重點應該是分割網路的特徵融合和寬度增加。 3, 文章使用GAN應用在兒童超聲心臟病上的出發點很好,希望可以幫助更多的兒童擺脫先天性心臟病的