1. 程式人生 > >領域應用 | 中醫臨床知識圖譜的構建與應用

領域應用 | 中醫臨床知識圖譜的構建與應用

本文轉載自公眾號:e醫療。

知識圖譜是近年來知識管理和知識服務領域中出現的一項新興技術,它為中醫臨床知識的關聯、整合與分析提供了理想的技術手段。我們基於中醫醫案等臨床知識源,初步建立了由疾病、證候、症狀、方劑、中藥等核心概念所構成的中醫臨床知識圖譜,以促進中醫臨床知識的互融互通,揭示中醫方證的相關關係,輔助中醫臨床研究和臨床決策。

作者

中國中醫科學院中醫藥資訊研究所

於彤 李敬華 朱玲 於琦 田野 孫曉峰 徐麗麗

  中醫藥學是一門古老的醫學,歷代醫家在數千年的實踐中積累了豐富的臨床經驗,形成了完整的知識體系,產生了海量的臨床文獻。近年來,國家對中醫藥事業大力扶持,中醫藥領域的臨床實踐和臨床研究都取得了長足的發展。中醫臨床方法在國際社會得到廣泛認可,傳播到183個國家和地區。

  利用資訊科技手段開展中醫臨床知識的管理和服務是一項開創性的探索,在臨床上具有極大的應用價值。近年來,知識圖譜(Knowledge Graph)成為知識管理領域中的一項新興技術,因其簡單易學、可擴充套件性強、支援智慧應用等優點而得到廣泛應用。它有助於實現臨床指南、中醫醫案以及方劑知識等各類知識的關聯與整合,挖掘整理中醫臨證經驗與學術思想,實現智慧化、個性化的中醫藥知識服務,因此在中醫臨床領域具有廣闊的應用前景。

知識圖譜技術概述

  知識圖譜是以“語義網路(Semantic Network)”為框架構建起來的大型知識庫系統。語義網路可被視為一張巨大的圖,其中節點表示實體,邊則代表實體之間的語義關係。知識圖譜在語義網路框架中填充了大量的知識內容。這些知識內容來自資料庫、文獻庫、資料檔案等各種數字化資源。知識圖譜對分散的知識進行彙集和組織,可以有助於實現知識資源的關聯與整合,為解決“知識孤島”問題提供了理想的技術手段。

  近年來,國內外網際網路企業紛紛推出知識圖譜以提升服務質量,如:“谷歌知識圖譜(Google Knowledge Graph)”、“百度知識圖譜”和搜狗的“知立方”等。在學術界,知識圖譜的理論和技術也成為一個研究的熱點。已有學者在中醫藥知識圖譜構建方法與標準化流程方面進行了嘗試和探索[1]。於彤等[2]以中醫藥學語言系統作為骨架,集成了中醫藥領域的一系列資料庫,初步構建了一個大型的中醫藥知識圖譜,並將其嵌入中醫藥知識服務平臺之中加以利用。阮彤等[3]探索利用文字抽取、關係資料轉換以及資料融合等技術,實現中醫藥知識圖譜自動化構建的方法。張德政等[4]提出了基於本體的中醫核心知識圖譜表示及其構建方法,基於前期建立的“中醫基礎理論本體”構建了一箇中醫核心知識圖譜。Yuetal.[5]

利用中醫藥領域積累的數字化資源,構建了面向中醫養生領域的知識圖譜,從而實現術語、文獻、資料庫等相關知識資源的相互關聯和系統組織,促進中醫養生知識的共享、傳播與利用。這些前期的探索性工作展示出了知識圖譜在中醫藥領域的應用價值,驗證了在中醫藥領域構建大規模知識圖譜的可行性,也為進一步構建中醫臨床知識圖譜積累了經驗。

  中醫臨床領域有其自身的特點和需求,需要專門研究中醫臨床知識建模方法,解決中醫臨床知識的獲取、分類、表達、組織、儲存等核心技術問題,採集加工高質量的中醫臨床知識,才能建立準確、實用、完整的中醫臨床知識圖譜。鑑於此,我們開展了一項中醫臨床知識圖譜構建的專門研究。

  本研究以“證、治、效”為中心,對中醫臨床領域龐大的知識內容進行系統梳理,初步建立了一箇中醫臨床知識圖譜系統。該系統以中醫臨床領域本體作為骨架,集成了名醫經驗、臨床指南、中醫醫案、中醫文獻和方劑知識等多種知識資源,並實現了各類知識點之間的知識關聯。知識圖譜為中醫臨床知識體系的系統梳理和深度挖掘提供了新穎的方法,有助於實現中醫臨床知識的關聯、整合與視覺化,促進中醫臨床研究,輔助中醫臨床決策。

中醫臨床知識圖譜的構建

  中醫臨床知識是解決中醫臨床實際過程中特定問題的資訊集合。它們主要包括:臨床指南、名醫經驗、中醫醫案、臨床研究、臨床術語、古籍和期刊文獻資源(包括RCT文獻質量評價結果)、中藥方劑等等[6]。它們分散於不同的組織機構和資訊系統之中,尚未得到有效整合,形成一個個“知識孤島”,這嚴重影響了臨床應用的效果。

如圖1所示,通過由疾病、證候、症狀、方劑、中藥等核心概念構成的中醫臨床知識圖譜,可在這些“知識孤島”之間建立聯絡,增強中醫藥知識資源的聯通性,面向中醫藥工作者提供臨床知識的完整檢視。

圖1 中醫臨床知識圖譜示意圖

*請將手機橫屏後觀看

640?wx_fmt=jpeg

  中醫臨床知識圖譜的構建包括如下3個主要步驟。

(1)基於領域專家共識,設計中醫臨床領域的頂層本體,形成業界公認的技術規範。知識工程師們都可依據該規範進行知識圖譜加工,所產生的知識圖譜互相相容並能最終融合在一起。

(2)構建目標領域的語義網路,作為知識圖譜的骨架。例如,中醫臨床術語系統(Traditional Chinese Medicine Clinical Terminology System,TCMCTS)就是一個專門面向中醫臨床的大型語義網路,共收錄約11萬個概念、27萬個術語以及100多萬條語義關係[7]。在建立語義網路之後,就可以進行領域知識的填充工作了。

(3)從術語系統、資料庫和文字等知識源獲取知識,對知識圖譜內容進行填充。可將本領域中已有的術語系統和資料庫的內容轉換為知識圖譜,從而避免知識資源的重複建設。針對自由文字,可採用自然語言處理和機器學習等方法,從古今中外的各類中醫藥文獻中自動發現實體和語義關係,以自動或半自動的方式填充知識圖譜。

  在中醫臨床領域,構建知識圖譜的一個核心的知識源是中醫醫案。中醫醫案是中醫臨床思維活動和辨證論治過程的記錄,是中醫理法方藥綜合應用的具體反映形式[8]。特別是名老中醫的醫案,對於中醫理論和方法的傳承具有重要意義。中醫臨床知識以醫案形式分散於文獻之中,這不利於知識檢索以及臨床資料的分析與挖掘。

  近年來,在名老中醫經驗傳承的背景下,中醫醫案知識庫的構建成為學術界的一個熱點。例如,中國中醫科學院中醫藥資訊研究所研製了中醫醫案知識服務與共享系統,支援中醫專家對醫案進行編輯、管理和審校[9]。近期,該系統升級為一個雲服務平臺,並正式更名為古今醫案雲平臺(www.yiankb.com 點選“閱讀原文”可直達連結,提供醫案共享和大資料分析等雲服務。該系統集成了古代醫案庫、現代醫案庫、名醫醫案庫和共享醫案庫等一系列(半)結構化的醫案庫,收集醫案20餘萬例,這些醫案庫中儲存著豐富的中醫臨床知識,具有重要的分析價值。

  從中醫醫案到知識圖譜的知識轉換是中醫臨床知識圖譜構建中的核心任我們探索了醫案文字語義分析與知識獲取的方法,研發了中醫醫案語義分析與挖掘工具,它實現了醫案文字預處理、分詞、語義標註、語義檢索、醫案文字瀏覽等功能。我們採用這套工具,從中醫古代醫案中抽取結構化的中醫臨床知識,填入中醫臨床知識圖譜。所產生的知識圖譜主要包括如下資訊:名醫(如“施今墨”)的擅長疾病、經驗方以及弟子等資訊;方劑(如“竹葉石膏湯”)的作用、操作方法,以及相關疾病、症狀等資訊;疾病(如“肺脹”)的臨床表現、治療方法以及相關病症、養生方法、名醫等資訊;中藥(如“杏仁”)所治療的疾病以及相關方劑、名醫等資訊。

從知識學的角度分析,中醫臨床知識從低到高可分為“事實性知識”、“概念性知識”和“策略性知識”等多個層次。

  中醫醫案屬於基礎性的“事實型知識”,它直接記錄中醫臨床活動中發生的事實。中醫臨床知識圖譜則屬於“概念性知識”,它用於梳理概念體系以及表示概念之間的關係。從醫案知識向知識圖譜的轉換過程,實質上是一個知識抽象和歸納的過程。在這個過程中,一方面要完成知識抽取:對海量醫案文字進行分析和標註,從中抽取中醫知識;另一方面,要實現知識的結構化表示,也就是從醫案文字到結構化知識的轉換。在最高層則是問題求解和過程控制所需的“策略性知識”(通常用規則、過程等表示),它們是臨床決策支援系統的基礎。可見,知識圖譜處於中間層,在多維度、多層次、多主題的知識點之間建立關聯,在中醫臨床知識系統中起到重要的“粘合劑”作用。

中醫臨床知識圖譜的應用

  知識圖譜有助於對中醫臨床知識進行分類整理和規範化表達,促進中醫臨床知識的共享、傳播與利用,在臨床診療、臨床研究、教育、培訓等方面都具有應用價值。特別是可以將中醫臨床知識圖譜整合到知識服務系統之中,用於改進知識檢索、知識問答、決策支援和知識視覺化等多種服務的效果,從而提升知識服務能力[10]

如圖2所示,知識圖譜系統以圖形化的方式呈現中醫名家、疾病、特色療法、方藥、養生方法等概念之間的相互關係,實現中醫臨床知識體系視覺化。系統提供檢索框,用於檢索知識圖譜中的概念。

圖2 中醫臨床知識圖譜介面截圖

*可點選檢視大圖

640?wx_fmt=jpeg

  圖2所示系統還提供輔助知識框,用於提供相關概念知識和醫案文字以供參考。使用知識圖譜,使用者可快速找到與當前研究主題(如症狀、證候、體徵、疾病、方藥等)相關的醫案、指南和知識庫內容,輔助使用者進行決策。系統協助使用者在概念層次上瀏覽中醫臨床知識,發現概念或知識點之間的潛在聯絡,從而更好地駕馭複雜的中醫藥知識體系。

  中醫臨床知識圖譜為我們分析和揭示“證、治、效”之間的相關關係,提供了新穎的理念和方法。證、治、效是中醫臨床的靈魂,揭示三者之間的關聯關係對於提高中醫臨床療效具有重要意義。由於中醫療效的判斷十分複雜,加入療效這個因素後,使得三者關係的維度過高,目前的計算機模型很難處理,但我們可以選擇驗案作為研究方證對應關係的資料資源,因為驗案本身都具有良好療效。可在驗案的基礎上構建中醫臨床知識圖譜,全面收集中醫臨床中與“證、治、效”相關的資訊,從而再現中醫驗案中蘊含的相關關係(如方劑與證候的相關關係、症狀組合與證候的相關關係、藥物組合與方劑的相關關係等),揭示症狀組合規律、方劑配伍規律以及基於藥物組合和症狀組合的方證對應規律等。最後,可將這些相關關係和規律提供給臨床醫生,作為支援臨床決策的參考性依據。

知識圖譜是在“大資料”時代背景下出現的一項新穎的知識管理技術。

  在“大資料”時代,不再熱衷於尋找因果關係,轉而將注意力放在相關關係的發現和使用上。知識圖譜從多個維度來描述中醫藥領域物件,反映中醫藥事物之間的相關關係,它將是中醫藥大資料方法學體系中的核心組成部分。

  大資料通過識別有用的關聯關係來幫助我們分析一個現象,而不是揭示其內部的運作機制。基於相關關係分析的預測是大資料的核心。中醫的思想方法,不是嚴格的邏輯推理,而是一種關聯式的思考。中醫會把各種看起來不相關的事物聯絡起來進行思考,以期達到對天地人生的整體性認識以及宇宙規律的整體性把握。這種理念上的相似性,使得中醫藥工作者更易接受並使用“大資料”的方法與技術。利用中醫臨床知識圖譜,能夠發現中醫藥概念之間的相關關係,揭示各種臨床規律,從而不斷完善中醫臨床知識體系,直接推動中醫臨床研究的快速發展。

  在本研究中,我們以中醫臨床領域本體作為骨架,整合相關的結構性知識資源,初步構建了一箇中醫臨床知識圖譜。它實現了中醫臨床核心知識體系的視覺化,幫助我們分析中醫思維方法,梳理醫案中蘊含的知識,研究歷代醫家的用藥規律和治療方法,發現和總結名老中醫經驗,梳理中醫學術思想的發展源流和脈絡,釐清各代表流派的傳承關係,研究現代中醫臨床實踐和研究的發展動態。中醫醫案(特別是古代醫案)的知識獲取仍是中醫臨床知識圖譜構建中的重點和難點問題。古代醫案表述複雜,文字挖掘的難度超出預期。擬進一步深入研究,採用機器學習方法解決上述問題。

參考文獻   References

[1]李新龍,劉巖,何麗雲,.知識圖譜研究概況及其在中醫藥領域的應用[J].中國中醫藥資訊雜誌,2017(7).

[2]於彤,劉靜,賈李蓉,.大型中醫藥知識圖譜構建研究[J].中國數字醫學,2015,10(3):80-82.

[3]阮彤,孫程琳,王昊奮,.中醫藥知識圖譜構建與應用[J].醫學資訊學雜誌,2016,37(4):8-13.

[4]張德政,謝永紅,李曼,石川.基於本體的中醫知識圖譜構建[J].情報工程,2017,3(1):035-042

[5]Tong Yu, Jinghua Li, Qi Yu, et al. Knowledgegraph for TCM health preservation: Design, construction, and applications [J].ArtificialIntelligence in Medicine, 2017, 77:48-52.

[6]李敬華,於彤,李宗友,.中醫臨床知識庫的構建技術研究[J].中國數字醫學,2017,12(1):92-93,111.

[7]董燕,李海燕,崔蒙,.中醫臨床術語系統建設概況與改進措施[J].醫學資訊學雜誌,2014,35(8):43-48.

[8]彭笑豔.基於中醫醫案的知識庫構建[D].北京:北京科技大學,2009.

[9]於琦,李敬華,李宗友,.基於本體的中醫醫案知識服務與共享系統構建研究[J].中國數字醫學,2017,12(5):103-105.

[10]李敬華,李宗友,王映輝,.嵌入式臨床智慧決策支援系統設計與中醫臨床知識服務研究[J].中國數字醫學,2015,10(7):48-51.

-END-

e醫療原創文章,轉載請註明來源

640?wx_fmt=jpeg

OpenKG.CN

中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜資料的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。

0?wx_fmt=jpeg

點選閱讀原文,進入 OpenKG 部落格。