bs4.BeautifulSoup的基礎用法匯入

阿新 • • 發佈：2018-11-19

匯入模組

    from bs4 import BeautifulSoup

    soup = BeautifulSoup(html_doc,"html.parser")

下面看下常見的用法

 print(soup.a)
    # 拿到soup中的第一個a標籤



    print(soup.a.name)
    # 獲取a標籤的名稱


    print(soup.a.string)
    # 獲取a標籤的文字內容


    print(soup.a.text)
    # 獲取a標籤的文字內容


    print(soup.a["href"])
    # 獲取a標籤的href屬性的值

    print(soup.a.get("href"))
    # 查詢第一個a標籤的href的屬性

    print(soup.a.attrs)
    # 獲取a標籤的所有的屬性，返回一個字典



    print(soup.find("a"))
    # 查詢第一個a標籤


    print(soup.find_all("a"))
    # 查詢所有的a標籤


    print(soup.find_all(id="a1"))
    # 查詢所有的的id為a1的標籤


    print(soup.find_all(class_="sistex"))
    # 這裡需要注意，如果需要通過class去查詢，則需要一個下劃線


    print(soup.find_all(["a","p","br"]))
    # 查詢所有的啊標籤，p標籤和br標籤


    soup.find("a").attrs["class"] = "2b"
    # 修改某個標籤的屬性值

    del soup.find(id="a1").attrs["class"]
    # 刪除某個標籤的class屬性

    import re

    soup.find(re.compile("b"))
    # 標籤中有b這個字元的標籤


    soup.select("a.syster")
    # 這個可以放標籤選擇器

    soup.select(".syster .abcd")
    # 這個可以放標籤選擇器


    soup.find("a").decompose()
    # 從當前字串中刪除第一個a標籤，是在原位置進行刪除

bs4.BeautifulSoup的基礎用法匯入

匯入模組 from bs4 import BeautifulSoup soup = BeautifulSoup(html_doc,"html.parser") 　　下面看下常見的用法 print(soup.a) # 拿到soup中的第一個a標籤

Python3.6：bs4解析html基礎用法

實用 pri safari -a webkit con 內容 like div Python3.6：bs4解析html基礎用法代碼： import urllib.request from bs4 import BeautifulSoup import re url =

vector最最最基礎用法（非原創）

sort排序兩個 src per pre 開始程序 -1 logs 在c++中，vector是一個十分有用的容器，下面對這個容器做一下總結。 1 基本操作 (1)頭文件#include<vector>. (2)創建vector對象，vector<int

Vue組件基礎用法

options tag 基礎 one 靈活 tro 解耦 message rip 前面的話　　組件(Component)是Vue.js最強大的功能之一。組件可以擴展HTML元素，封裝可重用的代碼。根據項目需求，抽象出一些組件，每個組件裏包含了展現、功能和樣式。每個頁面，

react入門----組件的基礎用法

可能處理對象 amp array 方法字符串 arr 實例 1、組件 1 <!-- React 允許將代碼封裝成組件（component），然後像插入普通 HTML 標簽一樣，在網頁中插入這個組件。React.createClass 方法就用於生成一個組

js基礎用法1

finish ive fun object close appname isn innertext code click（）對象.click（）使對象被點擊。closed 對象.closed 對象窗口是否已封閉true/falseclearTimeout（對象）清除已

Sed 的基礎用法

sedSed 的基礎用法sed [ -nefr] [n1,n2] action-n: 是安靜模式，只有經過sed處理的行才會顯示，其他不現實-e:表示直接在命令行上執行。是默認選項不用填寫。-f: 將Sed的操作寫在一個文件裏面，用的時候-f filename 就可以按照內容進行Sed操作-r ：表示支持正則

JS---基礎用法2

prompt logs pro 轉換成整型 win 基礎 onclick log 休息 <!DOCTYPE html> <html> <head lang="en"> <meta charset="UTF-8">

詳細解讀-this-關鍵字在全局、函數、對象、jQuery中的基礎用法！

瀏覽器中 person ack true ++ 例子 span mar 編程一、前言 1、 Javascript是一門基於對象的動態語言，也就是說，所有東西都是對象，一個很典型的例子就是函數也被視為普通的對象。Javascript可以通過一定的設計模式來實現面向對

sscanf的最基礎用法（非原創）

urn clas 參數 detail tail include sca min col 1 #include<stdio.h> 2 #include<stdlib.h> 3 #include<string.h> 4 5 in

TensorFlow TensorFlow的基礎用法

非線性方程 false run 從零學習好的江湖 git 接下來相關原文： TensorFlow 優化實踐寫在前面的話在前面一章中說到了TensorFlow的基礎用法，這一章作為一個進階來聊聊神經網絡的具體的結構和參數問題，包括：前饋神經網絡循環神經網絡神經網

canvas基礎用法

eve element 繼承矩形區域轉換 src 展示當前位置順時針 canvas 是 HTML5 提供的一個用於展示繪圖效果的標簽. canvas 原意畫布, 帆布. 在 HTML 頁面中用於展示繪圖效果. 最早 canvas 是蘋果提出的一個方案, 今天已經在大

MongoDB配置與基礎用法

multi sta att 替換 core bin 系統 ram 多個 MongoDB 安裝官網：https://www.mongodb.com/ 手冊：https://docs.mongodb.org/manual/ win7系統需要安裝補丁，KB2731284

第12課：HTML+CSS的基礎用法

日常使用 mil rtc 一行 ade user 新頁面 form -s 1. html之head部分的常用標簽的使用  <!DOCTYPE html> <html lang="en

Python-if、for、while的基礎用法

分支代碼執行 pan 結束 nbsp 只需要 for 不想區別 Python的各種代碼執行，都是從上至下執行，滿足條件就返回，不會執行後面的代碼一、if　　　假如把寫程序比做走路，那我們到現在為止，一直走的都是直路，還沒遇到過分叉口，想象現實中，你遇到了分叉口，然後

日誌分析命令awk基礎用法

pri 取出 http 我只修飾符日誌自動文本處理工具 ssi awk awk是一個很好用的文本處理工具，相對於sed常用用作一整行的處理，awk則比較擅長將一行分成數個字段來處理。而在我們性能測試中，可以awk可以幫助我們造數，也可以幫助我們分析日誌。簡單來說

awk的基本概念，基礎用法和高級用法

awk 基本概念基礎用法高級用法 awk:文本處理三劍客：grep系，sed，awkgrep系：grep，egrep，fgrep，基於PATTERN進行文本過濾；sed：流編輯器，逐行編輯器；模式空間，保持空間；awk：報告生成器；格式化文檔輸出； awk是下面三個人的姓氏縮寫：

Promise 的基礎用法

AD int func val sof style AC mic soft Promise 是異步編程的一種解決方案，比傳統的解決方案–回調函數和事件－－更合理和更強大。它由社區最早提出和實現，ES6將其寫進了語言標準，統一了語法，原生提供了Promise 所謂Promis

文本三劍客之一 “sed”的基礎用法和高級用法

sed基礎用法 sed高級用法 sed工具；用法： sed [option]… ‘script’ inputfile… 常用選項： -n：不輸出模式空間內容到屏幕，即不自動打印[root@localhost ~]# sed -n -e “2p” -e “6p” f1 （2；6代表處理第幾行）-e:

unity3d 射線的原理，基礎用法

oid engine clas distance pda int rigidbody pub tps 射線：射線是3D世界中一個點向一個方向發射的一條無終點的線，在發射軌跡中與其他物體發生碰撞時，它將停止發射。 Ray射綫類和RaycastHit射綫投射信息類是射綫常用的

bs4.BeautifulSoup的基礎用法匯入

相關推薦