1. 程式人生 > >Python學習包的使用和介紹

Python學習包的使用和介紹

  jieba中文分片語件,可以把一個句子分開成為幾個詞

  • jieba.cut 方法接受三個輸入引數: 需要分詞的字串;cut_all 引數用來控制是否採用全模式;HMM 引數用來控制是否使用 HMM 模型
  • jieba.cut_for_search 方法接受兩個引數:需要分詞的字串;是否使用 HMM 模型。該方法適合用於搜尋引擎構建倒排索引的分詞,粒度比較細
  • 待分詞的字串可以是 unicode 或 UTF-8 字串、GBK 字串。注意:不建議直接輸入 GBK 字串,可能無法預料地錯誤解碼成 UTF-8
  • jieba.cut 以及 jieba.cut_for_search 返回的結構都是一個可迭代的 generator,可以使用 for 迴圈來獲得分詞後得到的每一個詞語(unicode),或者用
  • jieba.lcut 以及 jieba.lcut_for_search 直接返回 list
  • jieba.Tokenizer(dictionary=DEFAULT_DICT) 新建自定義分詞器,可用於同時使用不同詞典。jieba.dt 為預設分詞器,所有全域性分詞相關函式都是該分詞器的對映。

numpy:

                使用numpy,開發人員可以執行以下操作:

  •     陣列的算數和邏輯運算。
  •     傅立葉變換和用於圖形操作的例程。
  •     與線性代數有關的操作。 NumPy 擁有線性代數和隨機數生成的內建函式。

msgpack

用於序列化和反序列化

urllib.request:

      1.urllib2.urlopen()的使用,用來從網上獲取資訊。

            在python3中urllib和urllib2集合一個包了,就是urllib.request包。

 import urllib.request

 resp=urllib.request.urlopen("http://www.baidu.com")

    matplotlib:2D繪相簿