Datawhale 知識圖譜組隊學習 之 Task 2 基於醫療知識圖譜的問答系統操作介紹
阿新 • • 發佈:2021-01-12
一、引言
該專案主要分為兩部分:(專案連結)
- 第一部分:搭建知識圖譜。該部分的具體講解將在Datawhale 知識圖譜組隊學習 之 Task 3 Neo4j圖資料庫匯入資料進行介紹;
- 第二部分:啟動問答測試。構建一個簡單的基於 知識圖譜 的對話系統,該部分的具體講解將在Datawhale 知識圖譜組隊學習 之 Task 4 使用者輸入->知識庫的查詢語句和Datawhale 知識圖譜組隊學習 之 Task 5 Neo4j 圖資料庫查詢進行分別介紹;
本節的核心目標是 從 全域性對專案的執行過程進行介紹和講解;先跑通整個專案。
二、執行環境
- python3.0及以上
- neo4j 3.5.0及以上
- jdk 1.8.0
三、搭建知識圖譜
執行該過程,請確保已經安裝好 neo4j 和 jdk
執行 以下命令:
python build_graph.py
注:資料量較大,需要執行多個小時。
四、啟動問答測試
執行 以下命令:
python kbqa_test.py
問題:ModuleNotFoundError: No module named 'ahocorasick'
解決:pip install ahocorasick
問題:ImportError: cannot import name 'joblib' from 'sklearn.externals' (C:\Users\Ethan\anaconda3\lib\site-packages\sklearn\externals\__init__.py)
解決:pip uninstall joblib scikit-leran sklearn 然後 pip install Scikit-learn==0.20.4
問題:TypeError: an integer is required (got type bytes)
解決:將python3.8切換成python3.7