BeautifulSoup find() 和 find_all()

阿新 • • 發佈：2018-11-14

BeautifulSoup 裡的 find() 和 find_all() 可能是你最常用的兩個函式。藉助它們，你可以通過標籤的不同屬性輕鬆地過濾 HTML 頁面，查詢需要的標籤組或單個標籤。

這兩個函式非常相似，BeautifulSoup 文件裡兩者的定義就是這樣：

find_all(tag, attributes, recursive, text, limit, keywords)
find(tag, attributes, recursive, text, keywords)

很可能你會發現，自己在 95% 的時間裡都只需要使用前兩個引數： tag 和 attributes 。但是，我們還是應該仔細地觀察所有的引數。

tag
標籤引數 tag 前面已經介紹過——你可以傳一個標籤的名稱或多個標籤名稱組成的 Python列表做標籤引數。例如，下面的程式碼將返回一個包含 HTML 文件中所有標題標籤的列表：
.find_all({"h1","h2","h3","h4","h5","h6"})
attributes
屬性引數 attributes 是用一個 Python 字典封裝一個標籤的若干屬性和對應的屬性值。例如，下面這個函式會返回 HTML 文件裡紅色與綠色兩種顏色的 span 標籤：
.find_all("span", {"class":{"green", "red"}})
recursive
遞迴引數 recursive 是一個布林變數。你想抓取 HTML 文件標籤結構裡多少層的資訊？如果recursive 設定為 True ， find_all 就會根據你的要求去查詢標籤引數的所有子標籤，以及子標籤的子標籤。如果 recursive 設定為 False ， find_all 就只查詢文件的一級標籤。 find_all預設是支援遞迴查詢的（ recursive 預設值是 True ）；一般情況下這個引數不需要設定，除非你真正瞭解自己需要哪些資訊，而且抓取速度非常重要，那時你可以設定遞迴引數。

text
文字引數 text 有點不同，它是用標籤的文字內容去匹配，而不是用標籤的屬性。假如我們想查詢前面網頁中包含“the prince”內容的標籤數量，我們可以把之前的 find_all方法換成下面的程式碼：

nameList = bsObj.find_all(text="the prince")
print(len(nameList))

輸出結果為“7”。

limit
範圍限制引數 limit ，顯然只用於 find_all 方法。 find 其實等價於 find_all 的 limit 等於1 時的情形。如果你只對網頁中獲取的前 x 項結果感興趣，就可以設定它。但是要注意，這個引數設定之後，獲得的前幾項結果是按照網頁上的順序排序的，未必是你想要的那前幾項。

keyword
還有一個關鍵詞引數 keyword ，可以讓你選擇那些具有指定屬性的標籤。例如：

allText = bsObj.find_all(id="text")
print(allText[0].get_text())

BeautifulSoup find() 和 find_all()

BeautifulSoup 裡的 find() 和 find_all() 可能是你最常用的兩個函式。藉助它們，你可以通過標籤的不同屬性輕鬆地過濾 HTML 頁面，查詢需要的標籤組或單個標籤。這兩個函式非常相似，BeautifulSoup 文件裡兩者的定義就是這樣： find_a

BeautifulSoup之select find和find_all

log clas pan soup body 全部字符 pytho mit select find和find_all有什麽區別呢，請看代碼： from bs4 import BeautifulSoup html =‘‘‘<head>hello python

Python學習日記5|BeautifulSoup中find和find_all的用法

Python學習日記5|BeautifulSoup中find和find_all的用法是藍先生關注 2016.04.20 11:26* 字數 930 閱讀 37205評論 11喜歡 10 今天是4.20號。前天晚上看到蔣方舟的一句話：不要左顧右

Python的BeautifulSoup之find和find_all

D:\folder\envs\hh\lib\site-packages\bs4\element.py in __getattr__(self, key) 1805 def __getattr__(self, key): 1806 raise AttributeError(

centos使用find和grep命令

find grep 作為一個ITer需要竟要使用到命令行，find和grep命令了解非常必要，下面說些常用方法find查找文件find ./ -name 192.168.1.166_server_log #根據文件名查找find . -type f -name "*.phtml"

jQuery中focusin()和focus()、find()和children()的差別

nes jquery ams rip 1.4 fadein ++ display his jQuery中focus()和focusin()、focus()和children()的差別 focus()和focusin() focus()和focusin

實戰c++中的vector系列--對vector<自己定義類>使用std::find 和 std::find_if 算法

++ pac price key fadein 輸出 var getitem mod 之前博客講了一些關於std::find和std::find_ if的一些使用方法。可是沒有講述對於vector中存儲的是自己定義的類。那麽怎麽樣使用std::find和

常用批處理命令總結3之Find和FindStr

ttr 計算例如 ber 文件名忽略大小寫 cap 應該 dst @echo offfindstr /V "[4-4]" all210.txt > no4.txtpause::註釋 /n是顯示出來第幾行！查不帶4的可註冊的域名 find 作

c++ map之中find和count函數的區別

結果個數 make algo -h ring images str 代碼編程的時候比較常用，今天記錄一下，以後備用。使用count，返回的是被查找元素的個數。如果有，返回1；否則，返回0。註意，map中不存在相同元素，所以返回值只能是1或0。使用find，返回的是

jQuery中find和filter的區別

query spa com 區別 tex 自身技術 ext inf 這是jQuery裏常用的2個方法。他們兩者功能是完全不同的，而初學者往往會被誤導。首先我們看.find()方法：現在有一個頁面，裏面HTML代碼為;程序代碼 <div class="css"&

ES6內置方法find 和 filter的區別在哪

== find 繼續 9.png turn con bre 對象 AR find 和 filter 為ES6中過濾查找的一個內置方法假定有一個對象數組，根據指定對象的條件找出數組中符合的對象，要想查找出name:‘Cady‘的項 users= [ {name:

Linux文件查找find和locate

expr sysconfig 3.5 用戶實現文件大小 some 塊設備 ont 目錄第1章 locate文件查找 1 1.1 概述 1 1.2 locate文件查找的特性 1 第2章文件查找概述 1

在 linux 中 find 和 grep 的區別??

col linu 它的 -s glob 操作功能相關 round Linux 系統中 grep 命令是一種強大的文本搜索工具，它能使用正則表達式搜索文本，並把匹配的行打印出來。grep 全稱是 Global Regular Expression Print，表示

正則表達式（十一）——find和lookingAt

位置字符 find() spa ring 3-0 reset span reg 1、最基本的matches()方法 1 package com.wy.regular; 2 3 import java.util.regex.Matcher; 4 import j

linux 用find 和 rm進行批量刪除

find ./ -name _NA | xargs rm -rf 用 find 檢索出相應檔案（包括當下資料夾下面的檔案也能一併檢索出來），然後將檢索結果通過管道命令導向到引數 xargs 然後用rm命令進行刪除， -rf為刪除命令rm的引數， r表示遞迴刪除，f表示不需要確認也可以

xshell 中find和xargs一起使用

1、在當前目錄下查詢所有使用者具有讀、寫和執行許可權的檔案，並收回相應的寫許可權： find ./ -perm +777 | xargs chmod 700 2、查詢系統中的每一個普通檔案，然後使用xargs命令來測試他們分別屬於哪類檔案 find -type f | xargs f

python學習(25) BeautifulSoup介紹和實戰

BeautifulSoup是python的html解析庫，處理html非常方便 BeautifulSoup 安裝 pip install beautifulsoup4 BeautifulSoup 配合的解析器 # python標準庫 BeautifulSoup(html,'html.parser

es6的find和filter

區別在於find返回的是查詢到的第一個物件，filter返回的是查詢到的物件陣列舉個例子： list [{…}, {…}, {…}]0: {name: 1, color: “red”}1: {name: 2, color: “blue”}2: {name: 1}length: 3__pro

BeautifulSoup庫之find_all函式

　　BeautifulSoup將複雜的HTML文件轉換成一個複雜的樹形結構.每個節點都是Python物件.所有物件可以歸納為四種:Tag , NavigableString , BeautifulSoup , Comment . 　　　　

BeautifulSoup庫之find_all函數

mit 並不是樹形方便 lin 字符正則表達式的使用 http 方式　　BeautifulSoup將復雜的HTML文檔轉換成一個復雜的樹形結構.每個節點都是Python對象.所有對象可以歸納為四種:Tag , NavigableString , BeautifulS

BeautifulSoup find() 和 find_all()

相關推薦