1. 程式人生 > >python—BeautifulSoup學習總結

python—BeautifulSoup學習總結

1,BeautifulSoup( )接受的引數:
soup 就是BeautifulSoup處理格式化後的字串
(1)類似


html_doc = """
<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title"><b>The Dormouse's story</b></p>
<p class="story">Once upon a time there were three little sisters; and their names were
<a
href="http://www.jb51.net" class="sister" id="link1">
Elsie</a>, <a href="http://www.jb51.net" class="sister" id="link2">Lacie</a> and <a href="http://www.jb51.net" class="sister" id="link3">Tillie</a>; and they lived at the bottom of a well.</p> <p class="story">...</p
>
"""

(2)類似

html=urllib2.urlopen(r"http://www.sogou.com/")
soup=BeautifulSoup(html)

2,find_all(name, attrs, recursive, text, limit, **kwargs)

print soup.find_all('p')
print soup.find_all('p','title')

相關推薦

pythonBeautifulSoup學習總結

1,BeautifulSoup( )接受的引數: soup 就是BeautifulSoup處理格式化後的字串 (1)類似 html_doc = """ <html><head><title>The Dormouse's

Python基礎學習總結(一)

format 計數 python使用 flat rac 劃線 orm lex 讀取 1、變量和數據類型 1.1變量 1.每個變量都存儲了一個值——與變量相關聯的信息。 2.變量不僅可以為整數或浮點數,還可以是字符串,可以是任意數據類型。 1.1.1變量的命名和使用 變量名只

Python基礎學習總結(九)

nbsp you ons quest border lease sta 不能 lang 11測試代碼   編寫函數和類時,還可以編寫測試函數,通過測試可以確定代碼面對各種輸入都能正常工作。在程序中添加新代碼時,也可以對其進行測試,確定他們不會破壞程序的既有程序。要經常測試模

Python課程學習總結

.py tro 計算機程序 變參 left 時間 ges logs 代碼 Python的介紹 Python是一種高級動態、完全面向對象的語言,函數、模塊、數字、字符串都是對象,並且完全支持繼承、重載、派生、多繼承,有益於增強源代碼的復用性。 Python是一種計算機程序設計

[學習總結] python語言學習總結 (一)

用py也很久了,很多東西只知道拿來用,並沒有深究,感覺這樣是不夠的。 我決定寫這麼一篇總結,把很多遺忘的東西拾起來,把很多沒搞懂的東西搞清楚。 1.eval函式 用法:eval(expression, globals=None, locals=None) 解釋:將字串str當成有效的表

[學習總結] python語言學習總結 (二)

1.python中的拆包 之前就只寫了*可以是未知數量的引數,**可以傳入未知數量命名引數。這次詳細記下拆包。 def f1(a, *l): print(a) # 不拆包 print(l) # 拆包 print(*l) f2(l)

web自動化測試python+selenium學習總結----python編輯器pycharm環境安裝

下載安裝檔案 下載最新檔案路徑:https://www.jetbrains.com/pycharm/         安裝:     一直點選下一步即可      破解:     配置hosts檔案。C:\Windows\Sys

[學習總結] python語言學習總結 (三)

函式閉包 定義 延伸了作用域的函式(能訪問定義體之外定義的非全域性變數 作用 共享變數的時候避免使用了不安全的全域性變數 允許將函式與某些資料關聯起來,類似於簡化版面向物件程式設計 相同程式碼每次生成的閉包,其延伸的作用域都彼此獨立(計數器,登錄檔) 函式的一部分行為在編寫時無法預知

Python MySQL學習總結

python mysql總結 參考資料1:https://blog.csdn.net/yongheng0852/article/details/79508584 目錄 python mysql總結 1、啟動服務: 2、顯示所有資料庫: 5、使用資料庫 6、顯示所有的表

python~XML學習總結

XML簡介 1.指可擴充套件標記語言(extensible markup language) 2.是一種標記語言 3.被設計用於結構化、儲存和傳輸資料 4.沒有像html那樣具有預定義標籤,需要程式設計師自定義標籤 5.XML被設計為具有自我描述性,並且是W3C的標準 x

Python NumPy學習總結

class ndarray(object): """ ndarray(shape, dtype=float, buffer=None, offset=0, strides=None, order=None) An array obje

Python pandas學習總結

  本來打算學習pandas模組,並寫一個部落格記錄一下自己的學習,但是不知道怎麼了,最近好像有點急功近利,就想把別人的東西複製過來,當心沉下來,自己自覺地將原本寫滿的pandas學習筆記刪除了,這次打算寫上自己的學習記錄,這裡送給自己一句話,同時送給看這篇部落格的人,共勉   當你迷茫的時候,當你飽受煎熬

[ python編程 ] subprocess模塊學習總結

system rgs all 命令 參數 htm code屬性 pen block 轉載:http://www.jb51.net/article/48086.htm 從Python 2.4開始,Python引入subprocess模塊來管理子進程,以取代一些舊模塊的

[Python] wxPython 編輯框組件學習總結 (原創)

image target type 復制 運行 ati ctr textbox 滾動條 1、總結   1、常用4種 編輯框 的構造     1、普通編輯框              單行輸入的簡單編輯框 (?為所在框的對象,同下)       self.textBox =

python 學習總結2 多進程

imp 交互 發送信息 bob res pip 子線程 for test 多進程: 我們什麽時候需要多進程呢?我們知道python的多線程,實際不是真實的多線程,它同一時間在一個cpu執行一個任務,它通過上下文的切換來讓我看起來是多並發的, 那麽如果我們想要真正實現多個任務

Python學習總結 14 sphinx

學習總結 div -i logs http pytho all bsp pan 安裝 sphinx pip install sphinx -i https://pypi.douban.com/simple 參考資料: http://www.j

Python學習總結

python 學習 python lan target 學習總結 blank tar 總結 學習 Python 總結 Python 學習總結 【第01節】 Python 學習總結 【第02節】 Python 學習總結 【第03節】 Python 學習總結 【第04節

python 學習總結6 前端學習2

blog href utf-8 總結 head 默認 多余 har pytho html與css的繼續學習 1.css 書寫可以在style處先設置一個標簽的樣式 例如 這個將圖片的邊框設置為0 為多余的邊框,默認的img標簽有一個1px的邊框: <head>

python學習總結-----python安裝

python一、python簡介 python 是一種面向對象、解釋性的腳本語言,遵循 GPL 協議。語法簡單、社區強大、豐富的庫支持。又被稱為“膠水語言”。能把其他語言(主要C/C++)寫的模塊很輕松的結合在一起。二、python 安裝 windows下安裝pythonwindows下安裝python

python 學習總結3

今天 pre 小程序 brush mas 返回 等待 add 學習總結 今天學習了socket的一些知識,主要為socket模塊中socket()類及其父類的一些方法 只要包括: sock=socket.socket() sk.bind(address) #