利用卷積神經網路進行阿爾茨海默病分類的神經影像模式融合 論文研讀筆記
原文連結
發表: 2018.11.13
摘要
阿爾茨海默病(AD)分類的自動化方法具有巨大的臨床益處,並可為防治該疾病提供見解。深層神經網路演算法通常使用諸如MRI和PET的神經學成像資料,但是還沒有對這些模式進行全面和平衡的比較。為了準確確定每個成像變體的相對強度,本研究使用阿爾茨海默病神經成像倡議(ADNI)資料集在阿爾茨海默病痴呆分類的背景下進行比較研究。此外,本文還分析了在融合環境中使用這兩種模式的益處,並討論了在未來使用深度學習的AD研究中如何利用這些資料型別
引言
計算機輔助診斷的自動化方法可以大大提高篩選高危個體的能力。該研究將集中在兩種不同的神經影像學模式:結構T1加權MRI和AV-45澱粉樣PET。研究的主要目的是比較這些模式中的每一種單獨使用的有效性,以及當這兩種模式都被用作融合系統時的有效性。考慮到輸入資料的視覺特性,該工作選擇應用一種非常適合計算機視覺任務的模型:卷積神經網路(CNN)
相關工作
早期的方法通常使用線性分類器,如支援向量機(SVM)來手工製作生物特徵。這些特徵可以在個體體素水平上定義,如組織概率圖的情況,或者在區域水平上定義,包括皮質厚度和海馬形狀或體積。有研究表明全腦方法通常比基於區域的方法獲得更高的分類精度。此外,有證據表明,某些資料預處理方法,即DARTEL註冊包[3],可以顯著影響分類結果。這兩項發現為在本工作中使用全腦容量並在分類演算法之前設計一個健壯的註冊流水線提供了依據
由於每個卷積層中的共享濾波器權重,這些模型非常適合於具有2D或3D資料的任務。目前,雖然存在利用多種資料型別並應用最新的神經網路體系結構的方法,但是模態和體系結構之間的比較研究在使用資料集時是隨意的,並且缺乏對模型有效性的解釋。並且,在之前的相關研究中使用的預處理管道也是不同的。該研究在這兩個方面都做了新的研究
首先,對本工作中使用的預處理進行了清楚的解釋,並提供了每個步驟的原理
第二,模態比較結果在生物學上下文中討論,該上下文更有效地描述了每個資料型別的相對效能
方法論
預處理操作對最終的分類效能有重大影響。因此,該研究開發了一個管道來校正成像資料中固有的幾個偏差。雖然管道的元件採用現有演算法,但總體結構與以前的工作不同,並允許在MRI和PET模式之間進行更公平的比較。研究使用CNN網路地體系結構,因為調查的主要目的是比較資料模式而不是網路型別,所以CNN被設計成代表由標準網路層組成的可比較的方法
預處理
預處理流水線旨在糾正原始MRI和PET資料中可能存在的幾種偏差,這也消除了網路學習方法糾正或忽略這些偏差的額外負擔。取而代之的是,該網路具有在健康與阿爾茨海默病患者之間發現模式的單獨任務
管道的構建如下
MRI偏差校正
由於掃描器的發射/接收不均勻性,MRI影象可能具有低頻偏置分量。這種空間不均勻性雖然並不總是在視覺上顯而易見,但是可能導致影象處理管道出現問題。因此許多MRI處理方案開始於應用偏置場校正演算法,非引數非均勻強度歸一化(N3)是消除這種偏置場的一種穩健且成熟的方法:它優化了緩慢變化的乘法場,當去除時,恢復真實訊號的高頻分量。這項工作選擇採用一種稱為N4的更新方法,該方法利用B樣條擬合來改進校正。該步驟對原始MRI影象執行,但是對於PET影象是不必要的
仿射登記
兩個影象模態都使用線性仿射變換進行配準。註冊的目的是消除掃描器中個體之間的任何空間差異,即從標準方向進行小的平移和旋轉。通常,掃描被註冊到腦圖譜模板,例如MNI152。
顱骨剝離術
顱骨剝離用於從影象中去除非腦組織體素。這通常被構造為一個分割問題,如在FSL的腦提取工具(BET)中使用聚類來相應地分離體素。然而,考慮到掃描已經註冊到標準空間,顱骨剝離是一項簡單的任務。使用MNI152空間中的腦掩模來消除MRI和PET影象中的任何非腦體
單個主題的預處理流水線
在進行下一步操作之前,要對資料集中的單個患者的所有MRI和PET影象執行該預處理。在任何配準步驟之前,N4校正應用於所有MRI掃描。所有MRI掃描被登記到第一掃描時間點,並且所得影象被平均以建立平均模板。N4校正掃描在被註冊到MNI152模板之前被註冊到這個空間。然後使用二進位制掩碼對得到的影象進行顱骨剝離
PET掃描用計算機斷層掃描進行衰減校正。PET採集的前10分鐘被重建成兩個5分鐘的幀。框架被一起校正,並且被整個小腦參考(標準化)。每個PET掃描以6自由度配準被配準到個體的平均T1模板,然後從平均T1到MNI152的預先計算的12自由度配準被連線並應用於PET影象,以將它們從原生PET移動到MNI152空間。最後,對PET影象進行顱骨剝離
網路
CNN架構在其結構上是相當傳統的,該網路以全3D MRI或PET影象作為輸入,並輸出診斷標籤。雖然網路中存在多個處理層,但只有三種不同的型別:卷積層、最大池層和完全連線層。卷積層構成CNN的骨架,3D過濾器與層的輸入卷積在一起。每個核由在整個輸入影象中共享的學習權重組成;並且,每個處理層可以有多個可訓練的核,這允許核心專門化,同時仍然提供捕獲每個層的變化的能力。在卷積層之後,通常具有最大池層。這些層通過輸出給定區域中的最大響應來對輸入影象進行下采樣。完全連線的層通常放置在CNN的末端。這些層採用早先在網路中學習的區域特定的卷積特徵,並允許每個特徵之間的連線。這些層中的權重也是可訓練的;因此,這些層聚合區域特徵並學習它們之間的全域性連線。結果,CNN中的最終完全連線層的輸出是最終診斷標籤
CNN架構1
(以單個MRI或PET體積作為輸入,輸出為“Healthy”或“AD”的二進位制診斷標籤,卷積層和前兩個全連線層使用ReLU啟用函式,最後一個全連線層使用softmax函式)
CNN結構2
(同時輸入一個MRI和一個PET,該架構上下部分都是一個單獨的架構1,只是在最後增加了一個128節點的全連線層,並且將核的數量由20減少到10,則是為了保持引數數量的一致)
實驗結果
使用以下3個技術可以將MRI分類準確性提高到95%
- A. Gupta, M. Ayhan, and A. Maida, “Natural image bases to represent neuroimaging data,” in International Conference on Machine Learning, 2013, pp. 987–994.
- A. Payan and G. Montana, “Predicting alzheimer’s disease: a neuroimaging study with 3d convolutional neural networks,” arXiv preprint arXiv:1502.02506, 2015.
- E. Hosseini-Asl, R. Keynton, and A. El-Baz, “Alzheimer’s disease diagnostics by adaptation of 3d convolutional network,” in Image Processing(ICIP), 2016 IEEE International Conference on. IEEE, 2016, pp. 126–130
基本上,這項研究更清楚地說明了MRI和PET模態之間的差異,並建議MRI模態可能對用於計算機輔助診斷的機器學習演算法更有資訊
研究的最後值得注意的結果是融合網路的效能優於單個MRI和PET網路。此外,儘管使用了較少的資料點,但融合網路的效能優於MRI網路。在融合情況下有更多的PET掃描可以進一步提高準確性,該研究清楚地表明,即使PET的資訊量較少,也能夠提供互補的資訊以提高分類精度
結論
這項工作比較核磁共振成像和澱粉樣蛋白PET成像在應用深層神經網路進行計算機輔助診斷的有效性。具體而言,設計並訓練了兩個結構相同的CNN,分別使用MRI和澱粉樣PET資料進行預處理,以便儘可能公平地進行比較。分類結果表明,MRI資料比澱粉樣PET資料更有利於神經網路訓練預測臨床診斷。然而,使用兩種模式的網路,即使具有相同數量的可訓練權重,也將實現更高的精度。這表明這兩種資料型別具有互補資訊,可以在這些型別的任務中使用這些資訊