1. 程式人生 > >python學習之爬蟲:BeautifulSoup

python學習之爬蟲:BeautifulSoup

att clas XML http ng- making bsp style span

一、功能:

BeautifulSoup是用來從HTML或XML中提取數據的Python庫。

二、導入:

from bs4 import BeautifulSoup

import bs4

三、編碼格式:

soup使用Unicode編碼

四、對象種類:

有四種類型:Tag,NavigableString,BeautifulSoup,Comment。
BeautifulSoup將文檔轉化為樹形結構,每個節點都是上述四種類型的Python對象。

tag屬性:name、attrs

參考網址:

1、http://python.jobbole.com/84774/

2、https://www.crummy.com/software/BeautifulSoup/bs4/doc/#making-the-soup

3、http://wiki.jikexueyuan.com/project/python-crawler-guide/beautiful-soup.html

python學習之爬蟲:BeautifulSoup