1. 程式人生 > >Automated and Interpretable Patient ECG Profiles for Disease Detection, Tracking, and Discovery 筆記

Automated and Interpretable Patient ECG Profiles for Disease Detection, Tracking, and Discovery 筆記

1摘要

1.1背景:

ecg已使用100餘年,在 心臟結構、心電活動 等大多數診斷檢測表現優異。尤其是近四十年起源於探索式模型的自動解釋方法;

1.3方法:

資料來源--36186條ecg資料來自UCSF資料庫,包括正常竇性心律及用於訓練特殊模型的心電圖

目標--訓練心臟結構、功能、疾病診斷的模型

          使用cnn網路及hmm模型進行ecg的切分工作(ecg segmentation),通過對比輸出與有臨床評估的141864個間隔進行比較

2材料與方法

2.1資料

本文使用UCSF的資料

2.2目的

開發一個自動、量化、可解釋的方法 來描述 1)心臟結構 2)舒張功能 3)通過病人的ecg截面圖診斷疾病

下圖為主要結構圖

工作流說明:

使用UCSF的資料中的子集訓練用於評估心臟結構、功能以及診斷疾病的可解釋模型

ECG的分割槽能夠用於計算標準生理區間,然後使用輸出結果與 MUSE/UCSF 參考資料進行比對驗證

一致性較好的ECG用於生成725維的疾病級別心電輪廓向量,使用梯度提升模型訓練迴歸和分類模型;

會檢驗各模型,生成潛在的主要特徵

各模型使用的ecg數量有所不同,數值顯示在各模型的小括號中

疾病診斷模型中,斜槓前為目標疾病數量,後為總ecg條數

原文如下:

2.3心電圖資料介紹

標準12導聯心電圖,來自2010年-2017年uscf的MUSE ECG資料庫,資料格式為XML;

送終選取了36186條超過十秒的12導聯記錄

60%資料記錄頻率為500HZ,40%資料記錄頻率為250HZ

每一條臨床ECG記錄最初由GE軟體進行分析,資料解釋性由UCSF的心臟學家進行確認和修正

2.5卷積神經網路ECG切分

訓練資料,來自兩個資料來源 112ecg來自PTB疾病診療資料集,58條來自UCSF資料集。每一條ECG提取兩秒的步長並手動標註六種(P波、PR節段、qrs混合波、st節段,t波、tp節段),使用網路結構如下

使用的網路結構基於U-net 網路,使用12*2000的向量作為輸入,由32個卷積層、5個池化層、3個反捲積層組成的收縮和擴張結構,最終的輸出是一個ecg切分分類向量,與輸入資料長度相等

細節:本文中的網路基於U-net結構,但有所改變,輸入為一維的向量,架構由“卷積區N”( "Convolution Blocks N" )組成,也就是用3個連續的1*N的卷積核組成的卷積層,同時使用相同的padding過程;輸入為2000*12的圖形(12導聯各自抽樣200個畫素點),進入這種收縮擴張過程中。

在收縮和擴張過程中包含七個“卷積區”,大小包括 1*19,1*15,1*11三種;,收縮功能由2*2的最大池化層實現;五個卷積塊後出現擴張節段有8*8的反捲積層( deconvolution layer )與一個2*2的反捲積層實現,中間還包括兩個卷積塊。連線一個12*1的卷積層結合12導聯資料成為一個一維特徵向量,再次進入第二個收縮擴張部分,最終連線一個1*9的卷積層輸出一個6類分割槽的輸出,所有擴張過程的反捲積層輸出都會concate相同維度的卷積塊輸出

優化過程使用的ADAM優化器 初始學習率為1E-5,batch-size為5,權重衰減為1E-7,最後一個卷積層使用0.5的dropout,迭代次數500次,用時4小時。

2.6 使用隱馬爾可夫模型增強ecg切分效果

儘管u-net提供了精準的切分,但無法使用ecg各節段的順序關係,例如ST節段緊跟qrs波後,T波緊跟ST節段後

因此增加第二個模型--hmm,使用u-net的輸出作為輸入,從而提升切分

hmm四要素:所有狀態的全集,本文中指各種型別的節段;各種狀態的基線概率;狀態間的轉移矩陣;發射概率矩陣

hmm模型控制了噪聲輸入資料,例如U-net的輸出,很多樣例中的位置被賦予錯誤的標籤,這些錯誤的分佈不是均勻分佈,例如在tp節段有事可以被解釋為一個心的p波,但絕不能在tp節段存在一個QRS混合波

我們將使用手工分割槽資料訓練基線概率以及轉移概率,從U-net輸出學習發射概率