1. 程式人生 > >在Windows下離線安裝pyhanlp

在Windows下離線安裝pyhanlp

HanLP是一款優秀的中文自然語言處理工具,可以實現包括分詞、詞性標註、實體識別在內容諸多功能,詳情見其專案主頁。另外,該工具包還提供了python3的介面,線上安裝很方便,但有時需要部署在內網機等沒有網路環境的機器上,比較繁瑣,整理步驟如下:

  1. 安裝jpype1,這是pyhanlp的依賴包,可以下載編譯好的.whl檔案,地址在,選擇對應自己python版本和作業系統版本的後,用pip install *.whl進行安裝即可。
  2. 安裝java環境,由於HanLP是用java開發的,因此呼叫python的介面時機器上應該配置了java環境,可以在網上搜索安裝。
  3. pyhanlp
    的專案主頁下載完整的.zip壓縮包,解壓後進入資料夾執行python setup.py install
  4. 下載data-for-1.7.0.ziphanlp-1.7.0.-release.zip,解壓後分別獲得data資料夾和hanlp.propertieshanlp-1.7.0.jar檔案。
  5. 進入python包的安裝目錄,以Anaconda為例,進入該安裝目錄下的./lib/site-packages/pyhanlp-0.1.44-py3.6.egg/pyhanlp資料夾,將4中得到的檔案複製到本目錄,保證目錄的內部結構如下:
    hanlp
    |—static
    |  |—data
    |  |  |—dictionary
    |  |  |—model
    |  |  |—READ.html
    |  |  |—version.txt
    |  |—init
    .py
    |  |—hanlp.properties
    |  |—hanlp.properties.in
    |  |—hanlp-1.7.0.jar
    |  |—index.html
    |—init.py
    |—main.py
    |—server.py
    |—util.py
  6. 編輯hanlp.properties中的內容,更改其中root=行的內容,使其指向data資料夾的上一層,如root=D:/Anaconda/Lib/site-packages/pyhanlp-0.1.44-py3.6.egg/pyhanlp/static
  7. 開啟命令列,輸入hanlp -v,檢查是否安裝成功。正常應該返回jar包、data資料夾和hanlp.properties
    的位置。