【Treatment-Rec 論文閱讀】Data-driven Automatic Treatment Regimen Development and Recommendation
Data-driven Automatic Treatment Regimen Development and Recommendation
Authors: Leilei Sun, Chuanren Liu, Chonghui Guo, Hui Xiong, Yanming Xie
Keywords: Treatment Regimen; Treatment Recommendation, Electronic Medical Records; Temporal Sets.
KDD’16 大連理工大學 (Dalian University of Technology),卓克索大學 (Drexel University),中國中醫科學院 (China Academy of China Medical Sciences)
論文連結:https://dl.acm.org/doi/pdf/10.1145/2939672.2939866
目錄
0. 總結
本文方法比較清晰,專注於腦梗塞這一種疾病,給新進入系統的病人推薦治療方案。但假設比較強,是治療方案推薦的很好的初步嘗試。
資料是在中國收集的,不知道相關資料集和程式碼是否已經公開?
1.研究目標
根據歷史病歷資料,對患者和治療方案分別進行分類,並提取出一些典型的治療方案。對新患者,根據患者基本資訊和診斷資訊,推薦相應的治療方案,輔助醫療決策,提高治癒率和治療有效性。
2.問題背景
電子病歷資訊沒有被充分利用,醫療資源分佈不均,大資料手段可以提高醫療效率,提高整體醫療水平。
3. 問題定義-EMR 的內容
本文用到的電子醫療記錄(Electronic Medical Records, EMRs)主要包含以下五種資訊:
3.1 人口統計資訊 Demographic Information
包含患者的基本資訊,如性別、年齡、家庭住址、種族、受教育程度等資訊。
3.2 診斷資訊 Diagnostic Information
包含疾病名稱和嚴重程度
3.3 醫囑 Doctor Order
包含藥物名稱、使用方式、劑量、頻率、開始日期和結束日期。
3.4 治療方案 Treatment
治療方案是在醫囑之上整理出來的,記錄患者每天接受了哪些治療。
進一步,可以將患者的病程分為幾個階段,每個階段都有幾個治療方案,其中記錄了患者接受了哪些治療,分別接受了幾次(這裡就不記錄這幾次治療具體發生的日期,而是隻記錄次數)。
3.5 結果 Outcome
結果指患者出院時醫生對患者的狀態評估,可以分為“治癒(cured)“,“改善(improved)”,“無效(ineffective)”,“死亡(dead)”。
上面五種資訊中,前兩個(基本資訊和診斷資訊)可以視為條件,第四個(治療方案)可以視為干預變數,最後一個(結果)可以視為目標。
4. 方法
4.1 治療方案相似度度量
總體思路:每個患者的治療方案可以被分為多個階段的治療方案,每個階段的治療方案包含用了哪些藥物,以及服用方式、劑量和使用次數。在相似度度量時,首先度量各個對應階段之間的相似度(如果階段數量不一樣怎麼辦?),然後再整合得到整體相似度。
- 治療方案相似度首先被拆分為藥物之間的相似度——相同名稱的藥物會有非零相似度,再根據服用方式、劑量和頻率來計算一個0到1之間的相似度數值。
- 兩個分階段治療方案之間的相似度變為兩個集合之間的相似度度量,其中集合元素之間的相似度已知。
- 本文提出一種矩陣,將元素之間的相似度加權組合為集合之間的相似度。
- 得到各個階段治療方案的相似度之後,再加權平均得到兩個治療方案的整體相似度
4.2 治療方案聚類
基於治療方案之間的相似度,本文提出一種基於密度峰值的聚類演算法,可以得到治療方案的聚類中心。
4.3 提取典型治療方案
由於本場景的特殊性,聚類中心的治療方案也無法完全代表這類每個類別,仍需進一步處理。
具體來說,就是看一下哪些藥物用的比較多,再提取一下典型的使用劑量、使用方式和持續時間等資訊。
4.4 治療方案推薦
對病人也進行分類(決策樹),每個葉子節點認為是一個型別的患者,然後看一下這些患者使用哪個典型治療方案比較多,就作為這個葉子節點的推薦方案。
5. 實驗
5.1 資料
資料來自中國14家三甲醫院,分佈在北京,石家莊,深圳,濟南,長春,福州和西安。
實驗專注於腦梗塞的藥物推薦。
收集了2.7萬的患者資料,醫囑數量100萬。
5.2 提取典型治療方案
其中使用了1090種藥物,但大多數藥物都是用於治療其他疾病的。本文選取了138種最相關的藥物,有36萬醫囑包含這些藥物,平均每個患者13個。
治療過程分為四個階段:前24小時、2-3天、4-7天、8-14天。
最終提取出四種典型的治療方案
5.3 治療方案推薦
對病人進行分類,分了17個類別。每個類別找一個治療效果最好的(不一定是使用最多的)作為推薦結果。
5.4 推薦效果評估
由於每個類別都找到了統計上治療效果最好的治療方案,假設這些治療方案推廣到這個類別上的所有患者,再假設推廣到其他患者身上之後仍然有這麼好的治療效果,計算一下推廣之後,總體的治療有效率和治癒率能提升多少。