1. 程式人生 > >Bs4 BeautifulSoup取值

Bs4 BeautifulSoup取值

原文網址:https://blog.csdn.net/u010244522/article/details/79627073

從網頁獲取HTML資料後,獲取對應標籤、屬性的值

取值方法主要有以下幾種:

1.通過標籤名(tag)獲取: tag.name        tag對應的type是<class 'bs4.element.Tag'>

2.通過屬性(attrs)獲取:tag.attrs

 

通過標籤屬性獲取:    tag["class"]  或     tag.get("class")

 

獲取對應的內容

1.    tag.string    獲取當前標籤的內容

2.    tag.get_text()    獲取標籤內所有的字串

查詢相應的內容

1.find_all(class_="class")    返回的是多個標籤,格式為<class 'bs4.element.ResultSet'>

2.find(class_="class")    返回一個標籤,格式是<class 'bs4.element.Tag'>

3.select_one()    返回一個標籤,格式是<class 'bs4.element.Tag'>

4.select()    返回的是多個標籤,格式為<class 'bs4.element.ResultSet'>

1和4是返回組標籤(就算只有一個標籤也是一組)

取值時需要先定位,定位是list(ResultSet)中的那個標籤在取值

tag[0].string

使用    find_all()    不帶條件查詢,tag[0]["class"].string

--------------------- 作者:bluelikk 來源:CSDN 原文:https://blog.csdn.net/u010244522/article/details/79627073?utm_source=copy 版權宣告:本文為博主原創文章,轉載請附上博文連結!