1. 程式人生 > >爬蟲的入門庫urllib庫,請求,用法-案例篇

爬蟲的入門庫urllib庫,請求,用法-案例篇

from urllib.request import urlopen
#匯入相應的庫

#urllib.request和requests兩者之間的差別,大體功能是一樣的,具體用法,後面你自己感覺哪個適合自己

url ='http://www.baidu.com/'
#今天咱們爬取百度首頁,是不是很傻,就是因為百度首頁,沒啥東西啊,拿簡單的東西入手,給自己信心啊
response= urlopen(url)

info =response.read()
#讀取響應,返回的是bytes格式
print(info.decode())
#列印網頁html,列印網站
print(response.getcode())
#列印響應
print(response.geturl())
#列印請求的實際網站,實際url網址,防止重定向
print(response.info())
#列印伺服器的響應的http報頭

打幾行程式碼瞭解一下,它能得到什麼,你不能光看看,還是你去打一打,程式碼沒多少,但是你照著打完,你在看看打印出的結果,是不是有點資訊了,從網站HTML,到返回狀態碼,到訪問的網址HTTP,到什麼頭,

開啟谷歌瀏覽器f12,Network看看你那個和什麼一樣啊!!!不動手永遠不知道這個東西是啥?