在Windows下離線安裝pyhanlp
阿新 • • 發佈:2018-12-20
HanLP是一款優秀的中文自然語言處理工具,可以實現包括分詞、詞性標註、實體識別在內容諸多功能,詳情見其專案主頁。另外,該工具包還提供了python3的介面,線上安裝很方便,但有時需要部署在內網機等沒有網路環境的機器上,比較繁瑣,整理步驟如下:
- 安裝
jpype1
,這是pyhanlp
的依賴包,可以下載編譯好的.whl
檔案,地址在這,選擇對應自己python版本和作業系統版本的後,用pip install *.whl
進行安裝即可。 - 安裝
java
環境,由於HanLP是用java開發的,因此呼叫python的介面時機器上應該配置了java環境,可以在網上搜索安裝。 - 在
pyhanlp
的專案主頁下載完整的.zip
壓縮包,解壓後進入資料夾執行python setup.py install
。 - 下載
data-for-1.7.0.zip
和hanlp-1.7.0.-release.zip
,解壓後分別獲得data
資料夾和hanlp.properties
、hanlp-1.7.0.jar
檔案。 - 進入python包的安裝目錄,以
Anaconda
為例,進入該安裝目錄下的./lib/site-packages/pyhanlp-0.1.44-py3.6.egg/pyhanlp
資料夾,將4中得到的檔案複製到本目錄,保證目錄的內部結構如下:
hanlp
|—static
| |—data
| | |—dictionary
| | |—model
| | |—READ.html
| | |—version.txt
| |—init
| |—hanlp.properties
| |—hanlp.properties.in
| |—hanlp-1.7.0.jar
| |—index.html
|—init.py
|—main.py
|—server.py
|—util.py - 編輯
hanlp.properties
中的內容,更改其中root=
行的內容,使其指向data
資料夾的上一層,如root=D:/Anaconda/Lib/site-packages/pyhanlp-0.1.44-py3.6.egg/pyhanlp/static
。 - 開啟命令列,輸入
hanlp -v
,檢查是否安裝成功。正常應該返回jar
包、data
資料夾和hanlp.properties