python之爬蟲的入門02------爬取圖片、異常處理
阿新 • • 發佈:2018-11-13
一、爬取一張圖片
import urllib.request req = 'http://placekitten.com/400/400' # url地址 response = urllib.request.urlopen(req) #用檔案形式來開啟url地址對應的HTML頁面 cat_img = response.read() #讀取資料 with open('cat01.jpg','wb') as f: #上下文管理器生成jpg檔案儲存資料 f.write(cat_img) print(response.geturl()) #geturl 展示的是url地址 print(response.info()) #info 展示一個物件,物件包含了遠端伺服器返回的head資訊 print(response.getcode()) #getcode 返回HTTP的狀態,200表示ok
二、爬蟲異常處理
import urllib.request import urllib.error #這裡的url地址:http://www.ooxx-fishc.com 是不存在的 req = urllib.request.Request('http://www.ooxx-fishc.com') try: #嘗試獲取內容,獲取不到或者出現其他錯誤,轉入except html = urllib.request.urlopen('http://www.baidu.com/ooxx.html') print(html) except urllib.error.HTTPError as e: print(e.code) print(e.read())