1. 程式人生 > >Python自然語言處理nltk庫中的一些重要的模組

Python自然語言處理nltk庫中的一些重要的模組

nltk庫中的一些重要的模組
——nltk.corpus
————獲取語料庫。
——————語料庫和詞典的標準化介面
——nltk.tokenize,nltk.stem
————字串處理
——————分詞,句子分解,提取主幹
——nltk.collocations
————搭配探究
——————t檢驗,卡方檢驗,點互資訊
——nltk.tag
————詞性識別符號
——————n-gram,backoff,Brill,HMM,TnT
——nltk.classify,nltk.cluster
————分類
——————決策樹,最大熵,樸素貝葉斯,EM,k-means
——nltk.chunk
————分塊
——————正則表示式,n-
gram,命名實體 ——nltk.parse ————解析 ——————圖表,基於特徵,一致性,概率性,依賴項 ——nltk.sem,nltk.inference ————語義解釋 ——————λ演算,一階邏輯,模型檢驗 ——nltk.metrics ————指標評測 ——————精度,召回率,協議係數 ——nltk.probability ————概率與估計 ——————頻率分佈,平滑概率分佈 ——nltk.app,nltk.chat ————應用 ——————圖形化的關鍵詞排序,分析器,WordNet檢視器,聊天機器人 ——nltk.toolbox ————語言學領域的工作 ——————處理SIL
工具箱格式的資料