Python自然語言處理nltk庫中的一些重要的模組
阿新 • • 發佈:2018-12-16
nltk庫中的一些重要的模組
——nltk.corpus
————獲取語料庫。
——————語料庫和詞典的標準化介面
——nltk.tokenize,nltk.stem
————字串處理
——————分詞,句子分解,提取主幹
——nltk.collocations
————搭配探究
——————t檢驗,卡方檢驗,點互資訊
——nltk.tag
————詞性識別符號
——————n-gram,backoff,Brill,HMM,TnT
——nltk.classify,nltk.cluster
————分類
——————決策樹,最大熵,樸素貝葉斯,EM,k-means
——nltk.chunk
————分塊
——————正則表示式,n- gram,命名實體
——nltk.parse
————解析
——————圖表,基於特徵,一致性,概率性,依賴項
——nltk.sem,nltk.inference
————語義解釋
——————λ演算,一階邏輯,模型檢驗
——nltk.metrics
————指標評測
——————精度,召回率,協議係數
——nltk.probability
————概率與估計
——————頻率分佈,平滑概率分佈
——nltk.app,nltk.chat
————應用
——————圖形化的關鍵詞排序,分析器,WordNet檢視器,聊天機器人
——nltk.toolbox
————語言學領域的工作
——————處理SIL 工具箱格式的資料