用python爬取鬥圖啦圖片
阿新 • • 發佈:2019-01-08
一、程式碼部分
# -*- coding:utf-8 -*- '''1、python版本 python3.6 2、IDE PyCharm 2017.3 ''' import requests import urllib.request import re #獲取每一個主頁面中的分類條目url連結 def get_page(num): html = requests.get("http://www.doutula.com/article/list/?page=)"+str(num)).text reg = '<a href="(.*?)" class="list-group-item'urls = re.findall(reg, html) return urls #獲取分類條目中每個圖片的url連結 def get_pic(urls): html = requests.get(urls).text reg = '<img src="(.*?)" alt' urls = re.findall(reg, html, re.S) return urls #下載圖片 n=1 for x in range(2): print("正在下載第{}頁......".format(x+1)) for i in get_page(x): forj in get_pic(i): pic_file = "D:/0PyCharmProject/pic/"+str(n)+".jpg" urllib.request.urlretrieve(j, pic_file) n = n + 1 print("下載完成,共下載{}張圖片".format(n-1))
二、執行結果
三、下載圖片