1. 程式人生 > >AD預測論文研讀系列1

AD預測論文研讀系列1

A Deep Learning Model to Predict a Diagnosis of Alzheimer Disease by Using 18F-FDG PET of the Brain

原文連結

提要

目的

開發並驗證一種深度學習演算法,該演算法可以基於腦部18F FDG PET來預測AD、輕度認知障礙或者二者均不是的診斷結果,並將其效能與放射學閱讀器的效能進行比較

材料和方法

來自ADNI的18F-FDG PET腦圖(含2109張圖片,包括1002個病人)用於訓練、驗證,40張來自40個病人的影象(來自作者所屬的機構--獨立測試集)用於測試集。使用InceptionV3架構的卷積神經網路在90%的ADNI資料集上訓練,並在剩餘的10%的資料上測試。同樣的測試集用於放射性閱讀器進行效能比較。模型分析了靈敏度、特殊性、ROC、saliency map、和t-分佈隨機鄰域嵌入

結果

該演算法在預測獨立測試集(82%特異性,100%敏感度)(它們平均將在75.8個月後進行最終診斷)的結果評估的ROC曲線下的面積為0.98(95%置信區間:0.94,1.00)。該結果要比放射性閱讀器(57%(4/7)敏感性,91%(30/33)特異性,P<.05)的效能更優越。顯著性圖(Saliency map)顯示了對已知感興趣區域的關注,但集中在整個大腦

結論

通過使用腦部18F FDG PET,該深度學習演算法在平均最終診斷之前的75.8個月之前的預測結果在100%敏感度下達到82%的特異性

正文

摘要

傳統上,AD患者在18F-FDG PET掃描中,後扣帶回、頂葉顳皮質和額葉區域的代謝往往較低,而MCI患者通常表現為後扣帶回和頂葉顳部代謝不良,額葉病變多樣

本研究旨在評估是否可以訓練深度學習演算法來預測接受18F-FDG PET大腦治療的患者的最終臨床診斷結果,並且一旦訓練,當對最終診斷為AD、MCI或者無痴呆跡象的患者的預測不同時,深度學習演算法如何與當前標準的臨床閱讀方法進行比較

研究假設深度學習演算法可以檢測出在標準臨床影象回顧中不明顯的特徵或模式,從而改善個體的最終診斷分類

資料預處理

成像資料通過網格方法進行預處理。將影象重新取樣到2-mm各向同性體素,並剪下到100 * 100 * 90畫素網格,形成200 * 200 * 180-mm3的體積。利用Otsu閾值選擇腦體素。採用連通成分分析法,選取腦實質100 * 100 mm2以上的頭顱和尾端截面,得出相應的成像容積。然後將總體積分為16個均勻間隔的部分,四捨五入到最近的軸向位置,並分佈到一個4 * 4網格中,其中頭骨最長的部分在左上,尾骨最長的部分在右下

預處理示例

用網格法對阿爾茨海默病(AD)患者PET進行預處理,圖中展示了三個示例患者:A,76歲的AD男性;B,83歲的MCI女性;C,80歲的非AD/MCI男性。在本例中,與非AD/MCI患者相比,AD患者呈現的灰質稍少。MCI患者與非AD/MCI患者的肉眼差異很小

模型訓練

經過預處理後,影象的矩陣大小為512 * 512。卷積神經網路架構使用Inception V3,網路首先在ImageNet進行預訓練,最後在ADNI資料集上進行微調。在訓練集上使用資料增強處理,包含隨機寬度和高度偏移(0%-10%),變焦(0%-8%)。在最後的全連線層之前新增比率為0.6的dropout層用作調節

模型模組

使用Inception-v3,該網路堆疊11個Inception模組,其中每個模組由池化層和卷積濾波器組成,校正線性單元作為啟用函式。模型的輸入是由預處理步驟產生的16個大腦水平部分的二維影象,放置在4*4網格上。三個全連線的層(大小分別為1024、512和3)被新增到最終的連線層中。在全連線層之前應用速率為0.6的dropout作為正則化方法。該模型對ImageNet資料集進行了預訓練,並進一步進行了微調,批量大小為8,學習率為0.0001,使用Adam隨機梯度優化演算法

模型解釋和資料視覺化

為了進一步直觀地瞭解網路是如何得出其決策的,顯示了10%ADNI測試集和獨立測試集的一個平均顯著性圖。顯著性圖繪製了與每個輸入畫素相關的AD類分數梯度,從而在影象上顯示被認為對分類結果重要的區域

在訓練資料上,對深度學習網路提取的特徵進行了t-分佈隨機鄰域嵌入(t-sne),提出了一種保持資料點相對貼近度的降維方法。在t-sne應用學習率200和1000次迭代以進一步將特徵維度降到2之前,首先通過主成分分析將1024個特徵降到維度30

模型測試與統計分析

在兩個測試資料集上測試了經過訓練的深度學習模型:10%的ADNI集作為內部保持測試集,獨立測試集作為外部測試集,由當地機構提供。該模型輸出影象屬於AD、MCI和非AD/MCI類的概率,選擇概率最高的類作為分類結果。繪製了模型在10%ADNI上的受試者工作特性曲線,計算了模型在10%ADNI下AUC的面積

模型訓練結果

使用來自ADNI的90%的資料進行訓練,10%的資料進行測試,預測AD、MCI和非AD/MCI的AUC分別為0.92、0.63和0.73。上述AUC表明,深度學習網路有合理的能力區分在成像時最終發展為AD的患者和那些留下進行MCI或非AD/MCI的患者,但在區分MCI患者和其他患者方面較弱。在AD、MCI和非AD/MCI的預測中,敏感性分別為81%(36例中的29例)、54%(79例中的43例)和59%(73例中的43例)、特異性分別為94%(152例中的143例)、68%(109例中的74例)和75%(115例中的86例),精確度分別為76%(38例中的29例)、55%(78例中的43例)和60%(72例中的43例)

Inception v3網路的ROC曲線在90%ADNI資料上訓練,並在95%CI的獨立測試集上測試的結果。預測AD、MCI和非AD/MCI的AUC分別為0.98(95%CI:0.94、1.00)、0.52(95%CI:0.34、0.71)和0.84(95%CI:0.70、0.99)。選擇概率最高的類別作為分類結果,在AD、MCI和非AD/MCI的預測中,敏感度分別為100%(7/7)、43%(7/3)和35%(26/9),特異性分別為82%(27/33)、58%(19/33)和93%(13/14),準確度分別為54%(7/13)、18%(3/17)和90%(9/10)。該模型具有很好的敏感性和對AD的合理特異性,在整個隨訪期(平均在76個月後結束)之前保留了預測最終診斷的強大能力

模型解釋:顯著性圖和t-sne圖

如b和c的顯著性圖第三行的第二和第三部分顯示了訊號分散區域中最強烈的訊號。結果表明,這些模式在確定AD患者的分類中具有重要意義,這與臨床意義一致,即顳頂區更多的尾端部分可提供AD的資訊。然而,這些模式還不夠具體,無法提取出一個統一的人類可解釋成像生物標誌物,總體而言,這些標誌物的顯著性和特異性與臨床意義一致。顯著性圖表明,深度學習模型在做出預測時考慮了整個大腦如a所示

在使用T-SNE進行降維後,由Inception v3網路提取的特徵將這三個類劃分為近似的三個叢集。當非AD/MCI組幾乎為純組時,MCI組與非AD/MCI組和AD組混合,AD組與其他兩類混合。這使研究人員對模型在測試時的行為有了深入的瞭解:由於幾乎所有的AD患者都位於AD群中,因此在AD類上獲得了較高的靈敏度;由於非AD/MCI群幾乎是純的,所以在非AD/MCI類上獲得了較高的精確度

討論

多個以前的研究表明,18F-FDG PET影象上皮質低代謝區的獨特分佈對區分AD或MCI與正常大腦有意義;然而,18F-FDG本身並不是AD或MCI的明確成像生物標誌物

深度學習演算法顯然利用了來自不同解剖區域不同程度影響的整個大腦來做出最終決定。這突出了深度學習演算法的優勢,該演算法在分類時將大腦視為逐畫素體積,這意味著深度學習演算法的診斷與人類解釋成像研究的不同

該項研究採用的測試資料進行過篩選,首先排除了大多數非AD神經退行性病例和其他可能影響記憶功能的神經疾病,如中風。使用的測試影象的患者群體具有特殊性,該演算法不具有一般推廣性

總的來說,研究表明,深度學習演算法可以通過18F-FDG大腦PET成像研究預測AD的最終診斷,具有很高的準確性和對外部測試資料的魯棒性。此外,本研究還提出了一種有效的深度學習方法和一組卷積神經網路超引數,並進行了驗證


CI = confidence interval
AUC = area under the ROC curve
t-SNE = t-distributed stochastic neighbor embedding

結論

論文中提出了使用Inception v3的卷積神經網路來進行AD的預測,但是並沒有詳細的描述出各部分的組成,當然也沒有提供程式碼。使用來自ADNI的90%的資料進行訓練,10%的資料進行測試,預測AD、MCI和非AD/MCI的AUC分別為0.92、0.63和0.73

該研究的測試結果在ADNI資料集上並不是很突出,在自己提供的資料集上表現的AUC很高,但是其提供的資料集不具有普遍特徵。不過預處理的方法和解釋結果的方法可以稍微研究一下

AD預測論文研讀系列2