1. 程式人生 > >Python3下的NLTK及nltk_data安裝問題(Ubuntu環境)

Python3下的NLTK及nltk_data安裝問題(Ubuntu環境)

在使用Python強大的第三方庫nltk進行一些自然語言處理工作的時候遇到了一些困難,折騰一番總算解決。現在在這裡記錄一下,當作備忘。

 

 

 

網上找到挺多安裝nltk的教程,但經測試,好像都是適用於Python2的,對於Python3,就勉為其難了。這裡的主要問題是,前輩們分享的nltk_data包是不相容Python3的。

 

 

 

所以我的解決方案是:

 

到https://github.com/nltk/nltk_data下載gh-pages分支,裡面的Packages就是我們要的資源。(注:截至2016年3月24日時本方案仍有效)

 

 

 

詳細情況記錄如下:

 

1.安裝nltk。截至今天,安裝的是nltk3.2,在有pip這些工具的情況下,安裝這些庫變得非常簡單:

 

pip install nltk

 

另外官方的安裝說明還附帶了numpy,一個“賽Matlab的Python開源的數值計算擴充套件庫”,說不定以後用得上:

 

pip install numpy