1. 程式人生 > >影像組學簡述

影像組學簡述

影像組學簡述

影像組學的工作流程

一、 影象採集
多模態的資料採集方法,使用各種成像方法的都有,不侷限。

二、影象分割
滑降區域生長法、圖割法、半自動分割演算法、基於容量CT的分割法,目前並無可用的通用的方法,自己的資料集有自己的方法。

三、影象特徵提取與量化(這是我們在特徵提取時可採用的方法)
影像組學特徵可以分為:形狀特徵,一階直方圖特徵,二階直方圖或紋理特徵。還有一些獲取於特定影象的影像組學特徵(如PET中的SUV度量),以及僅適用於多模式資料集的分形和融合特徵。
1、形態特徵:包括描述ROI大小的特徵,例如體積、表面積、二維和三維的最大直徑以及有效直徑(與ROI具有相同體積的球體直徑),以及描述ROI與球體的相似程度的特徵,如表面體積比、緻密度、偏心度、球形度等。(簡單來講,就是幾何形態上的特徵,就和我們計算的體積具有相同意義的特徵)
2、一階直方圖特徵(統計學特徵):描述與ROI內的體素強度分佈有關的特徵,不包含它們之間相互的空間作用,可通過直方圖分析計算得到,包括均數、中位數、最小值、最大值、標準差、偏度和峰度。這些特徵可反應所測體素的對稱性、均勻性以及區域性強度分佈變化。(簡單來講就是統計上可以計算出的影象灰度值存在的特徵)
3、二階直方圖特徵或紋理特徵(統計學特徵):是描述體素空間分佈強度等級的特徵。影象紋理是指在強度水平可感知或可測量的空間變化,它被視為一個灰度級,是一種視覺感知的影象區域性特徵的綜合。二階特徵包括:灰度共生矩陣(gray level co-occurrence matrix,GLCM)、灰度級長矩陣(gray level run-length matrix,GLRLM)、灰度級帶矩陣(gray level size zone matrix,GLSZM)和鄰域灰度差分矩陣(neighborhood gray-tone differencematrix,NGTDM)。(簡單來講,就是影象灰度值之間存在的相互關係)
1)灰度共生矩陣:是一個其行列數表示灰度值、單元格包含灰度值處於一定關係(角度、距離)次數的矩陣,也稱為二階直方圖。在灰度共生矩陣上計算的特徵包括熵(二階熵,與異質性有關)、能量(也被定義為角二次矩,再次描述影象的均勻性)、對比度(其測量區域性變化)、同質性(影象區域性灰度均衡性的度量)、不相似性和相關性。灰度共生矩陣的基本原理是影像上一定距離的兩個畫素的灰度值之間存在著一定的空間相關關係,對這個空間相關關係進行統計分析,利用各種紋理描述,改寫相關畫素的灰度值,使其紋理特徵能夠清晰顯示。
2)灰度級長矩陣:其中每個元素(i,j)描述了灰度級在指定的方向上連續出現的次數。
3)灰度級帶矩陣:是在行和列處的元素儲存具有灰度級和大小的區域(具有相同灰度級的連線體素)數量的矩陣。灰度級帶矩陣包括描述小/大區和低/高灰度區分佈的特徵。
4)鄰域灰度差分矩陣:是在行和列處的元素儲存具有灰度級和大小的區域(具有相同灰度級的連線體素)數量的矩陣。GLSZM包括描述小/大區和低/高灰度區分佈的特徵。
4、融合與分形特徵:融合特徵與多模態影象資料集相關,其可通過配準技術與幾何影象對齊。分形特徵是分析評估不同層面表面的自相似性和粗糙度,這些區域的複雜性由Hausdorff的分形維(fractal dimension, FD)量化呈現,該分形維是一個模式的自我重複紋理,並具有放大特徵。(之前沒有接觸過)
(田捷老師的一張圖,可以提取的特徵非常多)
注:
①pyradiomics是一個開源的python包,用於醫學影象的影像組學特徵提取。

四、特徵選擇(也就是特徵降維,篩選出有效特徵,這是核心)
最簡單的特徵選擇方法是根據變數的穩定程度或相關性制定一個評分標準,以此標準對變數進行篩選。另外,在消除相關特徵時,使用相關矩陣消除高度相關的特徵,通過消除那些高度相關的特性,剩下“非冗餘”的特徵集,其中常用的方法有LASSO(least absolute shrinkage and selection operator)Cox迴歸模型、最大相關最小冗餘(maximum relevance and minimum redundancy,mRMR)、RELIEF (RELevance In EstimatingFeatures)、主成分分析法(principal component analysis,PCA)等(之前用過PLS相關與迴歸分析,仍然可以用於我們的超聲實驗,PLS相關是集合主成分分析和典型相關分析的一種分析方法,其他的方法我覺得都不如PLS方法好,因為PLS既能解決y多x少的情況,也能解決x之間相關性比較強的情況)。

五、建立模型(預測與分類模型,與上述的特徵選擇可以一起做)
在影像組學建模中,logistic迴歸模型因其簡單易行,成為最受歡迎且常用的監督分類器;另外,常用的機器學習模型還有隨機森林(random forest)、支援向量機(SVM)、人工神經網路(Artificial neural networks,ANNs)、聚類分析(clustering analysis)、“leave-one out”交叉驗證(LOOCV)、自舉法(bootstrapping)。
1、隨機森林:是基於機器學習中一個較普遍的決策樹概念,將假設表示為連續的“如果-然後”,這一點很類似於人類推理。在該方法中,訓練一組決策樹,並且該演算法引入兩個級別的隨機化。所有的決策樹被訓練後,對所有單株樹進行預測,並將選出最高頻的一類作為最終結果。
2、支援向量機:是一種先前用於CAD的有辨識監督機器學習的技術,它利用邊界將資料點分為兩類(如反應者或無反應者),該方法在CAD微鈣化檢測中有較高的判別力,並經常用於影像組學。
3、人工神經網路:是經典的機器學習方法之一,也被用於基於超分類的基因組學研究。卷積神經網路(Convolutional Neural Network,CNN)是一種特殊的前饋神經網路,用於學習直接對原始影象進行操作的影象資料的分層表現,通過嘗試自動提取高度表現的成像特徵,CNN消除了對影象預處理和特徵選擇的依賴性。該方法在MRI對三陰乳腺癌的判別中要優於其他預測模型。
4、聚類分析:屬於無監督分類(unsupervised classifiers),其可將抽象物件集合分組,在分組的過程中對類似的物件組成的多個類進行分析,目標是在相似的基礎上收集資料來進行分類。共識聚類(consensusclusterin)是常用於降維的聚類分析。有報道稱共識聚類可以在440個特徵的集合空間中識別出13個非冗餘特徵聚類。
5、交叉驗證:該演算法除了一個數據點被用於測試外其餘所有資料均用於訓練或擬合,這個過程在每次LOOCV迭代中重複,使得每個資料點只剩下一次。
6、自舉法:由原始資料生成大量自舉樣本,引導資料集是一系列資料(特徵,結果),每個資料來自患者佇列中隨機選擇的患者,每個自舉樣本重複建模。該方法提供了模型引數和模型評估指數AUC或CI值的分佈,從而可以評估特徵的不確定性。
注:
①隨機森林推薦使用R包:randomForestSRC

六、選擇治療方法

影像組學的應用
1、CT紋理在肺癌鑑別、治療、生存期預測的應用;
2、採用深度學習(基於分割和分類的卷積神經網路CNNs)檢測膝關節磁共振中軟骨病變;
3、深度卷積神經網路(DCNN)在MR成像進行肝纖維化分期;
4、MR成像的放射組學分析鑑別良惡性乳腺病變;
5、利用影像組學分類心機梗塞;
6、CT影象紋理特徵預測治療的肝癌晚期