1. 程式人生 > 程式設計 >python爬蟲爬取圖片的簡單程式碼

python爬蟲爬取圖片的簡單程式碼

Python是很好的爬蟲工具不用再說了,它可以滿足我們爬取網路內容的需求,那最簡單的爬取網路上的圖片,可以通過很簡單的方法實現。只需匯入正則表示式模組,並利用spider原理通過使用定義函式的方法可以輕鬆的實現爬取圖片的需求。

1、spider原理

spider就是定義爬取的動作及分析網站的地方。
以初始的URL**初始化Request**,並設定回撥函式。 當該request**下載完畢並返回時,將生成**response ,並作為引數傳給該回調函式。

2、實現python爬蟲爬取圖片

第一步:匯入正則表示式模組

import re # 匯入正則表示式模組
import requests # python HTTP客戶端 編寫爬蟲和測試伺服器經常用到的模組
import random # 隨機生成一個數,範圍[0,1]

第二步:使用定義函式的方法爬取圖片

def spiderPic(html,keyword):
  print('正在查詢 ' + keyword + ' 對應的圖片,下載中,請稍後......')
  for addr in re.findall('"objURL":"(.*?)"',html,re.S): # 查詢URL
    print('正在爬取URL地址:' + str(addr)[0:30] + '...') 
    # 爬取的地址長度超過30時,用'...'代替後面的內容
    try:
      pics = requests.get(addr,timeout=100) # 請求URL時間(最大10秒)
    except requests.exceptions.ConnectionError:
      print('您當前請求的URL地址出現錯誤')
      continue
    fq = open('H:\\img\\' + (keyword + '_' + str(random.randrange(0,1000,4)) + '.jpg'),'wb') 
     # 下載圖片,並儲存和命名
    fq.write(pics.content)
    fq.close()

到此這篇關於python爬蟲爬取圖片的簡單程式碼的文章就介紹到這了,更多相關python爬蟲怎麼爬取圖片內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們!