Python(15)_爬區百度網頁並儲存
阿新 • • 發佈:2018-12-25
import urllib.request url ='http://www.baidu.com' response = urllib.request.urlopen(url=url) #print(response) # 列印物件 #print(type(response)) '''獲取返回的內容,read()得到的是二進位制的,要將二進位制轉換為str型,需要decode()方法''' # print(response.read().decode()) # # with open('baidu.html','w',encoding='utf-8',) as fp: # fp.write(response.read().decode())# 根據響應內容獲取到請求url print("根據響應內容獲取請求url: "+response.geturl()) #print(response.getheaders()) # 得到是列表,獲取請求頭 print(dict(response.getheaders())) # 列表轉換成字典,就可以獲取對應的鍵值對了 print(response.getcode()) # 獲取返回碼 # print(response.readlines()) 按行讀取,一般不用 ''' 直接以二進位制儲存下來''' with open('baidu1.html','wb') as fp1: fp1.write(response.read())