BeautifulSoup高階應用之 CSS selectors /CSS 選擇器

阿新 • • 發佈：2018-12-26

BeautifulSoup支援最常用的CSS selectors，這是將字串轉化為Tag物件或者BeautifulSoup自身的.select()方法。

本篇所使用的html為：

html_doc = """
<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title"><b>The Dormouse's story</b></p>

<p class="story"> 
Once upon a time there were three little sisters; and their names were
<a href="http://example.com/elsie" class="sister" id="link1">Elsie</a>,
<a href="http://example.com/lacie" class="sister" id="link2">Lacie</a> and
<a href="http://example.com/tillie" class="sister" id="link3">Tillie</a 
>;
and they lived at the bottom of a well.</p>

<p class="story">...</p>
"""

舉例，你可以這樣搜尋便籤：

soup.select("title")   #使用select函式
# [<title>The Dormouse's story</title>]

soup.select("p nth-of-type(3)")
# [<p class="story">...</p>]

另外，你也可以搜尋在其他父標籤內部的標籤，即通過標籤的所屬關係尋找標籤

：

soup.select("body a")   #搜尋在body標籤內部的a標籤
# [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,
#  <a class="sister" href="http://example.com/lacie"  id="link2">Lacie</a>,
#  <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]

soup.select("html head title")  #搜尋在html->head標籤內部的標籤
# [<title>The Dormouse's story</title>]

可以直接尋找在其他標籤內部的標籤：

soup.select("head > title")
# [<title>The Dormouse's story</title>]

soup.select("p > a")
# [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,
#  <a class="sister" href="http://example.com/lacie"  id="link2">Lacie</a>,
#  <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]

soup.select("p > a:nth-of-type(2)")
# [<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>]

soup.select("p > #link1")
# [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>]

soup.select("body > a")
# []

通過tags標籤獲得元素的同胞兄弟：

soup.select("#link1 ~ .sister")  #獲得id為link1，class為sister的兄弟標籤內容（所有的兄弟便籤）
# [<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>,
#  <a class="sister" href="http://example.com/tillie"  id="link3">Tillie</a>]

soup.select("#link1 + .sister")   #獲得id為link1，class為sister的兄弟標籤內容（下一個兄弟便籤）
# [<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>]

通過CSS的類獲得tags標籤:

soup.select(".sister") #獲得所有class為sister的標籤
# [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,
#  <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>,
#  <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]

soup.select("[class~=sister]")  #效果同上一個
# [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,
#  <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>,
#  <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]

通過id獲得標籤：

soup.select("#link1") #通過設定引數為id來獲取該id對應的tag
# [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>]

soup.select("a#link2")  #這裡區別於上一個單純的使用id，又增添了tag屬性，使查詢更加具體
# [<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>]

通過設定select函式的引數為列表，來獲取tags。只要匹配列表中的任意一個則就可以捕獲。

soup.select(“#link1,#link2”) #捕獲id為link1或link2的標籤
# [<a class=”sister” href=”http://example.com/elsie” id=”link1”>Elsie</a>, 
# <a class=”sister” href=”http://example.com/lacie” id=”link2”>Lacie</a>]

按照標籤是否存在某個屬性來獲取：

soup.select('a[href]') #獲取a標籤中具有href屬性的標籤
# [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,
#  <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>,
#  <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]

通過某個標籤的具體某個屬性值來查詢tags：

soup.select('a[href="http://example.com/elsie"]')
# [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>]

soup.select('a[href^="http://example.com/"]')
# [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>,
#  <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>,
#  <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]

soup.select('a[href$="tillie"]')
# [<a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]

soup.select('a[href*=".com/el"]')
# [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>]

這裡需要解釋一下：
soup.select(‘a[href^=”http://example.com/”]’) 意思是查詢href屬性值是以”http://example.com/“值為開頭的標籤，可以檢視部落格介紹。
soup.select(‘a[href$=”tillie”]’) 意思是查詢href屬性值是以tillie為結尾的標籤。
soup.select(‘a[href*=”.com/el”]’) 意思是查詢href屬性值中存在字串”.com/el”的標籤，所以只有href=”http://example.com/elsie”一個匹配。

如何查詢符合查詢條件的第一個標籤：

soup.select_one(".sister") #只查詢符合條件的第一個tag
# <a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>

BeautifulSoup高階應用之 CSS selectors /CSS 選擇器

BeautifulSoup支援最常用的CSS selectors，這是將字串轉化為Tag物件或者BeautifulSoup自身的.select()方法。本篇所使用的html為： html_doc = """ <html><head&g

CSS入門之樣式表與選擇器詳解

CSS用來定義HTML頁面中文字顯示樣式，還有類、層等特性，還可以對文字重疊、定位等。引入CSS到HTML中，主要是因為在傳統的HTML上控制文字顯示樣式和版面非常難，引入CSS之後，控制方式變得簡單，頁面也變得更加美觀、豐富。所以CSS主要就是用來提供樣

前端之CSS：CSS選擇器前端之css樣式（選擇器）。。。

前端之css樣式（選擇器）。。。一、css概述 CSS是Cascading Style Sheets的簡稱，中文稱為層疊樣式表，對html標籤的渲染和佈局

CSS/JQuery元素選擇器之&&和||，選擇器的邏輯操作

使用CSS或JQuery選中元素的時候，很多時候我們需要對條件進行&&或者||操作。 JQuery或者CSS中的||操作是很常用的，也很簡單，就是通過逗號來分隔的。 selecto

CSS之萬用字元選擇器、複合選擇器

一、萬用字元選擇器 1、 2、執行結果：作用於所有的標籤，所有文字顏色都變成了紅色二、符合選擇器 1、複合選擇器就是把上面的幾個單獨的基本選擇器混合來使用 2、 ① ② 3、 4、 ② ③ 5、 ① ② 6、

BeautifulSoup的高階應用之 find findAll

BeautifulSoup 是python學習的重要組成部分，可用於幫助解析html/XML等內容，尤其是在爬取特定網頁資訊的時候，用於解析和檢查在網上看到的那些亂七八糟而且不規範的HTML頁面。至於BeautifulSoup 模組的安裝可以參考部落格這

css的基本選擇器和設置cookie的一些代碼

pyw dex date() com 覆蓋 value time() 時間 pre ID選擇器：#header {}類選擇器：.header {}元素選擇器：div {}子選擇器：ul > li {}後代選擇器：div p {}偽類選擇器：a:hover {}屬性選擇

CSS偽類選擇器active模擬JavaScript點擊事件

css一、說明設置元素在被用戶激活（在鼠標點擊與釋放之間發生的事件）時的樣式。IE7及更早瀏覽器只支持a元素的:active，從IE8開始支持其它元素的:active。另：如果需要給超鏈接定義：訪問前，鼠標懸停，當前被點擊，已訪問這4種偽類效果，而又沒有按照一致的書寫順序，不同的瀏覽器可能會有不同的表現。超鏈

今天做項目用了CSS偽類選擇器“before”，就來了解了解它怎麽使用，又如何用？

偽類選擇器 line ref n) ima cnblogs hello 了解 nbsp 我不知道有沒有小夥伴以前跟我一樣，在一個元素內部想要添加一個小圖標或者小東西的時候，直接在HTML文檔裏自己加上<span>標簽，或者其他的。亦或者用javascript在

CSS常用的選擇器和優先級的權重問題

寫法 clas orange round spa one html 組成組合 CSS註釋 CSS修改頁面中的所有標簽，必須借助選擇器選中。選擇器中，可以寫多對CSS屬性，用{}包裹；每個屬性名與屬性值之間用:分隔，多對屬性之間，必須用;來分隔選擇器{ 屬性1:屬性值1;

css三種選擇器

jsp 選擇器 style clas text class tex red type 1.派生選擇器 <html><head><link href="a1.css" type="text/css" rel="stylesheet"><

CSS復雜選擇器

css3復雜選擇器 CSS 復雜選擇器對CSS復雜選擇器做一個簡單的總結：1-2 相鄰兄弟選擇器、通用兄弟選擇器 <style> p+b{ font-size:30pt; color:green;

1、CSS 語法和選擇器

pre size htm -a pan 選擇器屬性表內部冒號 CSS 規則由兩個主要的部分構成：選擇器，以及一條或多條聲明: h1 { color:blue; font-size:12px; } 選擇器通常是您需要改變樣式的 HTML 元素。每條聲明由一個屬性

css基礎屬性選擇器屬性值以指定字符開頭 / 結束

w3cschool text con content ctype 結束 title pre ima 禮悟：　　公恒學思合行悟，尊師重道存感恩。葉見尋根三返一，江河湖海同一體。虛懷若谷良心主，願行無悔給最苦。讀書鍛煉養身心，誠勸且行且珍惜。

css基礎交集選擇器簡單示例

類名標簽 pre set inf htm https win7 charset 禮悟：　　公恒學思合行悟，尊師重道存感恩。葉見尋根三返一，江河湖海同一體。虛懷若谷良心主，願行無悔給最苦。讀書鍛煉養身心，誠勸且行且珍惜。　　

CSS基礎-id選擇器

元素第一個 img 定義 color spa pid span OS 一、id選擇器 1、id選擇器： id選擇器可以為標有id的HTML元素制定特定的樣式 id選擇器以"#"來定

CSS基礎-屬性選擇器

charset clas inf -s utf-8 class style tle bsp 一、屬性選擇器： 1、對帶有指定屬性的HTML元素設置樣式 2、屬性和值選擇器 <!DOCTYPE html><html lang="zh-cn"

css的屬性選擇器中屬性值是區分大小寫的。

大小寫現在適用於 evel rom fire .org nbsp attribute 以前經常看到很多人說“css中通常只有class和id的值區分大小寫，屬性名和屬性值不區分大小寫” BLAH BLAH 接手別人項目的時候排了半天bug發現：css的屬性選擇器對於屬性

css偽類選擇器:not的用法

css偽類選擇器:not的用法說明： :not意為排除某個元素，可以多次疊加使用代碼： <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta name="viewport

css的各種選擇器

post 單選 ack footer radi 鼠標懸停 rate 屬性選擇器 tps css的各種選擇器一、基本選擇器 1. * 通用元素選擇器，匹配任何元素 2. E 標簽選擇器，匹配所有使用E標簽的元素 3. .info class選擇器，匹配所有class屬性中

BeautifulSoup高階應用 之 CSS selectors /CSS 選擇器

相關推薦

BeautifulSoup高階應用之 CSS selectors /CSS 選擇器