自然語言處理環境搭建,就是這麼簡單–(手把手教程)
最近看了一些關於自然語言處理方面的書,對其很感興趣,在昨天晚上搞到了深夜,總算功夫不負有心人,現在基礎環境已經搭建完成,閒言少敘,現將搭建的具體過程和遇到的問題分享給大家。
基礎環境:windows 7 32位作業系統
1.安裝Python(我安裝的是Python2.7,目錄C:\Python27)。可以到CSDN、OSChina、Sina Share等網站下載,也可以到Python官網下載:(推薦用這個)。
2.新增環境變數。在命令列模式下輸入:set PATH=%PATH%;C:\Python27這種方法最容易,當然也可以在計算機-->屬性-->高階系統設定-->環境變數,新增系統變數,變數名為
3.在命令列模式下執行python,出現如下圖所示,即說明Python已安裝成功。
把nltk-3.0.0解壓到C:\Python27目錄,開啟cmd,進到C:\Python27\nltk-2.0.3目錄(輸入:cd C:\Python27\nltk-3.0.0)
輸入命令:python setup.py install
5.這個時候,會報錯,因為缺少setuptools包沒有安裝。下載setuptools包,地址:http://www.cncrk.com/downinfo/28512.html,安裝後再執行python setup.py install
6.安裝PyYAML:到這裡下載:http://download.csdn.net/detail/caicai1617/7023063
下載之後執行exe檔案(程式會自動搜尋python27目錄)
7.在所有程式中找到python2.7資料夾,開啟IDLE,輸入import nltk,沒有錯誤的話,就說明安裝成功了。到這裡,NLP所需的基本python模組都已經安裝好了,然後要安裝NLTK_DATA了下載NLTK_DATA有好幾種方法,這裡我只介紹兩種。第一種:輸入import nltk,然後輸入nltk.download(),這樣就可以開啟一個NLTK Downloader(NLTK下載器),
8.在計算機-屬性-高階系統設定-高階-環境變數-系統變數-新建:變數名:NLTK_DATA,屬性值:C:\nltk_data。這一步與上面第二步的操作基本相同。
9.在IDLE下輸入:form nltk.book import *會出現下圖所示:
10.測試環境搭建的效果:接著第九步的操作,輸入:text2.concordance('is');結果如下所示:
說明:text2為NLTK資料包中的一段資料來源,是一大串字串。這句話實現的是從這一大串字串中找尋出包含is這個單詞的語句。
到此為止,基本的搭建已經完成,初學者的一點經驗,也是每個要學習自然語言分析必會的基本知識。如有什麼不懂的,歡迎在下面評論,我會及時回覆。