python爬蟲學習筆記（更新中）

阿新 • • 發佈：2020-09-16

requests庫簡單介紹

import requests
r = requests.get("url")
/*
r=requests.get(url,params=Node,**kwargs)

url:擬獲取頁面的url連結
params:字典或位元組流格式，可選
**kwargs:12個控制訪問的引數
*/

response的物件型別

r.status_code HTTP請求的返回狀態，200表示連線成功，404等表示失敗
r.text HTTP響應內容的字串形式，即url對應的頁面內容
r.encoding 從HTTP header中猜測的響應內容的編碼方式
- 如果header中不存在charset，則認為編碼是ISO-8859-1
r.apparent_encoding 從網頁內容中分析出的響應備選編碼形式（通常更準確）
r.content HTTP響應內容的二進位制形式（比如說一個圖片就是二進位制編碼）

requests庫的7個主要方法

requests.request()構造一個請求，支撐以下各方法的基礎方法
requests.get() 獲取HTML網頁的主要方法，對應於HTTP的GET
requests.head()獲取HTML網頁頭資訊的方法，對應於HTTP的HEAD
requests.post()向HTML網頁提交POST請求的方法，對應於HTTP的POST
requests.put()向HTML網頁提交PUT請求的方法，對應於HTTP的PUT（全部覆蓋式修改）

requests.patch()向HTML網頁提交區域性修改請求，對應於HTTP的PATCH（區域性修改）
requests.delete()向HTML頁面提交刪除請求，對應於HTTP的DELETE

requests庫常用異常

requests.ConnectionError 網路連線錯誤異常，如DNS查詢失敗、拒絕連線等
requests.HTTPError HTTP錯誤異常
requests.URLRequired URL缺失異常
requests.TooManyRedirects 超過最大重定向次數，產生重定向異常
requests.ConnectTimeout 連線遠端伺服器超時異常

requests.Timeout 請求URL超時，產生超時異常

HTTP協議

超文字傳輸協議。
HTTP是一個基於“請求與響應”模式的、無狀態的（第一次和第二次請求並沒有關聯）應用層協議。

HTTP協議採用URL作為定位網路資源的標識。

URL格式：\(http://host[:prot][path]\)

host:合法的Internet主機域名或IP地址
port:埠號，預設埠為80
path:請求資源的路徑

URL是通過HTTP協議存取資源的Internet路徑，一個URL對應一個數據資源。

python爬蟲學習筆記（更新中）

requests庫簡單介紹 import requests r = requests.get("url") /* r=requests.get(url,params=Node,**kwargs)

DP學習筆記——揹包專題（更新中）

01揹包 \\(dp[i][j]:=\\) 決策第\\(i\\)種物品、揹包總容量為\\(j\\)時的最大價值則\\(dp[i][j]\\)的取值有兩種：

前端學習筆記HTML5，CSS3（更新中）

技術標籤：筆記csshtmlhtml5前端 title: 前端學習筆記 date: 2020-12-13 tags: 前端筆記網頁分成三個部分：結構(HTML) 表現(CSS) 行為(JavaScript)

【筆記】Java基礎教程學習（更新中）

Java基礎語法 Hello World 程式碼 public class HelloWorld{ public static voidmain(String[] args){ System.out.println(\"HelloWorld!\");

學習筆記二分圖（更新中）

定義有兩個點集合（A，B，且A ∩ B=Ø），對於任意一個點，沒有一條邊能夠到達於他同集的點。稱A，B為二分圖的左部和右部。

python學習筆記（初極）—4.序列中的公共操作和推導式

前面學過的資料序列包括字串、列表、元組、字典和集合，它們之間有些操作方法是公共的。

Python基礎學習筆記（07）檔案操作

Python基礎學習（08）一、今日內容大綱初識檔案操作檔案操作的模式檔案操作的其他功能

Python基礎學習筆記（10）形參名稱空間

Python基礎學習（10）形參名稱空間一、今日內容大綱形參的補充內容名稱空間（名稱空間）

Python基礎學習筆記（16）主要模組

Python基礎學習（16）主要模組一、今日內容大綱 time 模組 datetime 模組 os 模組 sys 模組

Python基礎學習筆記（17）軟體開發規範

軟體開發規範一、為什麼要有軟體開發規範？ app 軟體不可能全部都寫在一個檔案中，載入效率低，不容易查詢，不規範。程式碼越多，你越不能放在一個檔案中，你需要將你的程式碼分成多個檔案，軟體開發規範應運而生。

Python socket學習筆記（一）

　　最近在看 Python的視訊，針對socket 程式設計做一個筆記一、socket是什麼？

Python socket學習筆記（三）

之前都是客戶端對伺服器的單執行緒操作。接下來學習 SocketServer 多執行緒 SockServer

Python基礎學習筆記（19）re 模組遞迴函式帶引數的裝飾器

Python基礎學習（19）re 模組Ⅱ、遞迴函式、帶引數的裝飾器一、今日大綱 re 模組

Python基礎學習筆記（20）遞迴詳解 shutil 模組 logging 模組

Python基礎學習（20）遞迴詳解 shutil 模組 logging 模組一、今日大綱遞迴詳解 shutil 模組

Python基礎學習筆記（21）二分查詢 os.walk() 面向物件基礎

Python基礎學習（21）二分查詢 os.walk() 面向物件基礎一、今日大綱遞迴演算法的擴充套件：二分查詢

Python基礎學習筆記（22）面向物件的名稱空間組合

Python基礎學習（22）面向物件的名稱空間組合一、今日大綱面向物件的名稱空間

Python基礎學習筆記（23）繼承類部分屬性的補充方法和函式利用 pickle 儲存物件

Python基礎學習（23）繼承類部分屬性的補充方法和函式利用 pickle 儲存物件一、今日大綱

Python基礎學習筆記（24）利用類理解queue和stack 經典類與新式類抽象類多型鴨子型別

Python基礎學習（24）利用類理解queue和stack 經典類與新式類抽象類多型鴨子型別

Python基礎學習筆記（25）super方法封裝 property裝飾器反射

Python基礎學習（25）super方法封裝 property裝飾器反射一、今日內容大綱 super 方法（繼承內容補充）

[ python ] pandas學習筆記（七）字串處理

技術標籤：pandas學習python資料探勘機器學習 import pandas as pd fpath = \'./ant-learn-pandas-master/datas/beijing_tianqi/beijing_tianqi_2018.csv\'