知識圖譜實戰系列(筆記)
阿新 • • 發佈:2019-01-29
第一章:
一、 知識圖譜與人工智慧
人工智慧的業務架構
人工智慧技術架構
智慧人機對話業務模型
人工智慧發展階段
一、 知識圖譜的典型應用
- 在語義理解中的應用
在傳統搜尋中僅僅通過匹配英達,兒子,無法正確區分開這三類問題,但是當引入實體關係的結構化資料後,就很容易區分。
- 在智慧搜尋中的應用
搜尋結果包括該實體的相關屬性 - 智慧問答
- 輔助決策
一、 知識圖譜的系統架構
- 知識獲取
- 知識儲存(RDF/neo4j)
- 知識表示
- 知識應用
知識架構:語義型別設計,語義關係設計
第二章:知識設計方法
知識圖譜基礎
知識單元的組織
語義型別設計(知識建模)
設計語義型別可以參照同行業內,已經構建好的語義型別的劃分。或者跨領域借鑑,複用(同知識領域)。如UMILS的
語義關係設計(知識建模)
-
參照法:
-
通過業務流程來梳理抽象關係
本體物件設計(知識建模)
- 由語義型別的模型,從最細粒度的語義型別去尋找本體物件
語義建模工具:protege
第三章:知識儲存
一、知識儲存模型
- RDBMS 關係型資料庫(資料量小)
- RDF 三元組(資料量小單網頁模式)
- Graph DBMS 圖資料庫(大體積)
儲存規則:對於不需要進行關係延申計算的資料不放入圖譜,這部分資料可使用適應的儲存並於知識圖譜中實體做連結;對於結構固定,實體屬性資訊豐富的實體類,使用其他資料庫儲存更能體現優勢。(不需要研究實體之間關係的資料,需要頻繁計算的資料不適合用知識圖譜儲存。)
儲存開銷會逐漸增大,當屬性比較多時,會產生大量的自連線,增加計算開銷。
二、RDBMS 關係型資料庫
1、對於關係資料庫:三元組表
1、對於關係資料庫:屬性表
每一個屬性做一張表
當不指定屬性查詢某個實體所有資訊時要遍歷所有的表,計算開銷比較大
3、對於關係資料庫:垂直分割
修改不方便
隨謂語增加
三、RDF 三元組
三、圖資料庫:
3.1圖資料庫的選擇:
RDF資料庫使用排行
圖資料庫使用排行:
3.2 Neo4j配置
- 配置java環境
- 配置變數名:NEO4J_HOME 變數值:D:\Neo4j\neo4j-community-3.3.6
- 配置path:D:\Neo4j\neo4j-community-3.3.6\bin\
- 安裝成服務:neo4j.bat install-service
- neo4j start
- neo4j stop
- neo4j restart
- neo4j status
3.3 Neo4j操作
shift+enter 換行
Enter 執行
:help 幫助
:clear
:play start歡迎介面
建立節點
()
(matrix)
(:Movie)
(matrix:Movie)
(matrix:Movie {title: “The Matrix”})
(matrix:Movie {title: “The Matrix”, released: 1997})
建立關係
–>
-[role]->
-[:ACTED_IN]->
-[role:ACTED_IN]->
-[role:ACTED_IN {roles: [“Neo”]}]->
3.2 Neo4j資料庫監控管理
:sysinfo
資料備份
neo4j-admin.bat help
neo4j-admin.bat dump help
資料庫刪除
第四章:專案實戰
一、自己動手開發聊天機器人
第五章:知識圖譜獲取
5.1知識圖譜獲取的方法
目前僅僅通過機器學習的方法構建的知識圖譜是不完備的,必須引入人工。
5.2.國內外可用知識圖譜
TCMLS中醫學語言系統
注:PPT來源 《知識圖譜實戰開發案例剖析》(張子良)。