Python 常用包整理
2.通過zlib實現壓縮與解壓字串的方法。
4.hashlib是涉及安全雜湊和訊息摘要,提供多個不同的加密演算法藉口,如SHA1、SHA224、SHA256、SHA384、SHA512、MD5等。
5.cookielib庫主要功能是提供可儲存cookie的物件。使用此模組捕獲cookie並在後續連線請求時重新發送,還可以用來處理包含cookie資料的檔案。
6.HTMLParser是Python自帶的模組,使用簡單,能夠很容易的實現HTML檔案的分析。
7.python
queue模組有三種佇列:
1、python queue模組的FIFO佇列先進先出。
2、LIFO類似於堆。即先進後出。
3、還有一種是優先順序佇列級別越低越先出來。
針對這三種佇列分別有三個建構函式:
1、class Queue.Queue(maxsize) FIFO
2、class Queue.LifoQueue(maxsize) LIFO
3、class Queue.PriorityQueue(maxsize) 優先順序佇列
8.Beautiful Soup
eautiful Soup提供一些簡單的、python式的函式用來處理導航、搜尋、修改分析樹等功能。它是一個工具箱,通過解析文件為使用者提供需要抓取的資料,因為簡單,所以不需要多少程式碼就可以寫出一個完整的應用程式。
Beautiful Soup自動將輸入文件轉換為Unicode編碼,輸出文件轉換為utf-8編碼。你不需要考慮編碼方式,除非文件沒有指定一個編碼方式,這時,Beautiful Soup就不能自動識別編碼方式了。然後,你僅僅需要說明一下原始編碼方式就可以了。
Beautiful Soup已成為和lxml、html6lib一樣出色的python直譯器,為使用者靈活地提供不同的解析策略或強勁的速度。
9.python的logging模組將日誌列印到了標準輸出中,且只顯示了大於等於WARNING級別的日誌,這說明預設的日誌級別設定為WARNING(日誌級別等級CRITICAL > ERROR > WARNING > INFO > DEBUG > NOTSET),
預設的日誌格式為:
日誌級別:Logger名稱:使用者輸出訊息。