1. 程式人生 > 其它 >【Treatment-Rec 論文閱讀】Data-driven Automatic Treatment Regimen Development and Recommendation

【Treatment-Rec 論文閱讀】Data-driven Automatic Treatment Regimen Development and Recommendation

Data-driven Automatic Treatment Regimen Development and Recommendation

Authors: Leilei Sun, Chuanren Liu, Chonghui Guo, Hui Xiong, Yanming Xie

Keywords: Treatment Regimen; Treatment Recommendation, Electronic Medical Records; Temporal Sets.

KDD’16 大連理工大學 (Dalian University of Technology),卓克索大學 (Drexel University),中國中醫科學院 (China Academy of China Medical Sciences)

論文連結:https://dl.acm.org/doi/pdf/10.1145/2939672.2939866


目錄

0. 總結

本文方法比較清晰,專注於腦梗塞這一種疾病,給新進入系統的病人推薦治療方案。但假設比較強,是治療方案推薦的很好的初步嘗試。

資料是在中國收集的,不知道相關資料集和程式碼是否已經公開?

1.研究目標

根據歷史病歷資料,對患者和治療方案分別進行分類,並提取出一些典型的治療方案。對新患者,根據患者基本資訊和診斷資訊,推薦相應的治療方案,輔助醫療決策,提高治癒率和治療有效性。

2.問題背景

電子病歷資訊沒有被充分利用,醫療資源分佈不均,大資料手段可以提高醫療效率,提高整體醫療水平。

3. 問題定義-EMR 的內容

本文用到的電子醫療記錄(Electronic Medical Records, EMRs)主要包含以下五種資訊:

3.1 人口統計資訊 Demographic Information

包含患者的基本資訊,如性別、年齡、家庭住址、種族、受教育程度等資訊。

3.2 診斷資訊 Diagnostic Information

包含疾病名稱和嚴重程度

3.3 醫囑 Doctor Order

包含藥物名稱、使用方式、劑量、頻率、開始日期和結束日期。

3.4 治療方案 Treatment

治療方案是在醫囑之上整理出來的,記錄患者每天接受了哪些治療。

進一步,可以將患者的病程分為幾個階段,每個階段都有幾個治療方案,其中記錄了患者接受了哪些治療,分別接受了幾次(這裡就不記錄這幾次治療具體發生的日期,而是隻記錄次數)。

3.5 結果 Outcome

結果指患者出院時醫生對患者的狀態評估,可以分為“治癒(cured)“,“改善(improved)”,“無效(ineffective)”,“死亡(dead)”。

上面五種資訊中,前兩個(基本資訊和診斷資訊)可以視為條件,第四個(治療方案)可以視為干預變數,最後一個(結果)可以視為目標。

4. 方法

4.1 治療方案相似度度量

總體思路:每個患者的治療方案可以被分為多個階段的治療方案,每個階段的治療方案包含用了哪些藥物,以及服用方式、劑量和使用次數。在相似度度量時,首先度量各個對應階段之間的相似度(如果階段數量不一樣怎麼辦?),然後再整合得到整體相似度。

  • 治療方案相似度首先被拆分為藥物之間的相似度——相同名稱的藥物會有非零相似度,再根據服用方式、劑量和頻率來計算一個0到1之間的相似度數值。
  • 兩個分階段治療方案之間的相似度變為兩個集合之間的相似度度量,其中集合元素之間的相似度已知。
    • 本文提出一種矩陣,將元素之間的相似度加權組合為集合之間的相似度。
  • 得到各個階段治療方案的相似度之後,再加權平均得到兩個治療方案的整體相似度

4.2 治療方案聚類

基於治療方案之間的相似度,本文提出一種基於密度峰值的聚類演算法,可以得到治療方案的聚類中心。

4.3 提取典型治療方案

由於本場景的特殊性,聚類中心的治療方案也無法完全代表這類每個類別,仍需進一步處理。

具體來說,就是看一下哪些藥物用的比較多,再提取一下典型的使用劑量、使用方式和持續時間等資訊。

4.4 治療方案推薦

對病人也進行分類(決策樹),每個葉子節點認為是一個型別的患者,然後看一下這些患者使用哪個典型治療方案比較多,就作為這個葉子節點的推薦方案。

5. 實驗

5.1 資料

資料來自中國14家三甲醫院,分佈在北京,石家莊,深圳,濟南,長春,福州和西安。

實驗專注於腦梗塞的藥物推薦。

收集了2.7萬的患者資料,醫囑數量100萬。

5.2 提取典型治療方案

其中使用了1090種藥物,但大多數藥物都是用於治療其他疾病的。本文選取了138種最相關的藥物,有36萬醫囑包含這些藥物,平均每個患者13個。

治療過程分為四個階段:前24小時、2-3天、4-7天、8-14天。

最終提取出四種典型的治療方案

5.3 治療方案推薦

對病人進行分類,分了17個類別。每個類別找一個治療效果最好的(不一定是使用最多的)作為推薦結果。

5.4 推薦效果評估

由於每個類別都找到了統計上治療效果最好的治療方案,假設這些治療方案推廣到這個類別上的所有患者,再假設推廣到其他患者身上之後仍然有這麼好的治療效果,計算一下推廣之後,總體的治療有效率和治癒率能提升多少。