【醫學影像】《Dermatologist-level classification of skin cancer with deep neural networks》論文筆記
這是一篇關於面板癌分類的文章,核心就是分類器,由斯坦福大學團隊發表,居然發到了nature上,讓我驚訝又佩服,雖然在方法上沒什麼大的創新,但是論文字身的工作卻意義重大,並且這篇17年見刊的文章,引用量已經達到1300多,讓人佩服,值得學習。
【出發點】現有的面板癌分類系統由於資料量不夠,同時只針對標準化的影象如面板鏡影象和組織影象,通用性不夠,還難以媲美醫生的水平,也就是說不能投入實際使用
【論文核心】利用inceptionv3訓練12萬張圖片,對面板癌的診斷達到可媲美面板科醫生的水平
【論文貢獻】1.從網際網路上收集12萬張面板癌影象,這其中大多數為普通的影象(不是醫學裝置產生的標準影象),並由面板科醫生打上類別標籤
2.設計一套分類演算法,對收集的影象進行詳細的分類
3.利用在imagenet上預訓練的inceptionv3在面板癌影象上訓練,可得到非常好的效果
下面詳細講一下這三個點,主要是第一點,這是一個工作量很大的事,也是我認為本文最大的貢獻所在。
1.資料
之前的面板癌分類系統使用的資料集較小,通常小於1000張影象,於是本文作者就在網際網路上收集了129450張影象,其中3374張是面板鏡影象(面板鏡是面板科醫生診斷時使用的專業手持裝置)
在這些影象中共包含2032中疾病,但是訓練分類器的時候,作者將輸出的類別精簡為757類,具體是如何做的就是本文的第二點貢獻啦,論文給出一個簡潔直觀的圖示,可以看到是一個樹結構,2032種疾病的每一個都是一個葉子結點,然後不斷向上聚合,形成更大的結點。
資料集是如何劃分的呢,127463張影象作為訓練集和驗證集,1942張作為測試集。
2.分類演算法
分類演算法的思路很簡單,從根節點開始遍歷,計算當前節點所屬類別包含的圖片數量,以上面的Benign節點為例,它包含的圖片數就是該節點下面所有葉子節點的圖片數目和,若該數目超出設定的閾值(本文為1000),則遞迴計算該節點的所有子節點,否則滿足條件,將該節點設為用來訓練的類別,即757之一。具體流程如下,思路還是很清晰的,也很合理。
3.網路
網路上其實沒啥新意,對於這種開創性的工作,確實不需要說網路有多大的創新
那麼本文的網路採用的是inceptionV3,很奇怪,另一篇cell上的關於眼病分類的文章採用的也是inceptionV3,其實現在普遍採用的分類器是resnet系列,而這兩篇重量級高質量文章都採用了inceptionV3,很奇怪。
網路的輸出為757類,具體見上面的圖,都是各種細分的面板區域,然後根據自己的需要,你可以對輸出概率進行求和,得出更大的更粗糙的類別的概率,這一點不難理解。
論文鍾對這一點有一個更直觀的圖解,綠色的結點構成757類輸出,紅色結點是更加粗糙更大範圍的分類,那麼大類的概率就是對下面子類概率的簡單求和。
【實驗結果】本文的分類實際上只針對兩種面板癌,也就產生了本文的兩個任務:角質形成細胞癌(keratinocyte carcinomas)vs 良性脂溢性角化病(benign seborrheic keratoses);惡性黑色素瘤 vs 普通的痣,在 21 位經過認證的面板科醫生的監督下,測試了它在活檢證實的臨床影象上的效能。第一例代表最常見的癌症的識別,第二例代表了最致命的面板癌的識別。深度卷積神經網路在這兩個任務上的表現都達到了所有測試的專家的水平,證明了該人工智慧的面板癌鑑定水平達到了媲美面板科醫生的水平。論文中的測試集用了三種資料,也就是共有三種測試,分別是epidermal lesions(上皮病變),melanocytic lesions(黑素細胞病變)和melanocytic lesions(dermoscopy)(也是黑素病變,只不過採用的是面板鏡影象),下面高能,圖示三種任務,都是二分類的。
定量的評估呢,本文采用敏感性-特異性曲線,也就是正樣本的召回率-負樣本的召回率,後者會隨著前者的增大而由1 降為0。上圖吧,可以看到,完全超過醫生的水平
那些紅色的點就是面板科醫生的水平,完全處於分類器的曲線下面,在不同的資料量和不同類的資料上都有91%以上的表現,我佛了。
總結下,這絕對是有重要貢獻的好文章,贊!