python 爬蟲抓取頁面圖片
阿新 • • 發佈:2019-02-06
# -*- coding: utf-8 -*- # path: D:/Python27/img/jpg.py import re import urllib import os #獲取html頁面的內容 def getHtml(url): cont = urllib.urlopen(url).read() return cont #獲取img標籤的url # String html html頁面的內容 # String dir 儲存圖片的目錄,預設為當前目錄 def getImg(html, dir): reg = r'class="BDE_Image" src="(.*?\.jpg)" size' imgre = re.compile(reg) imglist = re.findall(imgre, html) #目錄不存在則建立 cr_dir(dir) x = 0 #下載圖片 for imgurl in imglist: urllib.urlretrieve(imgurl, dir+'\\%s.jpg' % x) x += 1 print 'OK!' #目錄不存在則建立 def cr_dir(dir): if not os.path.exists(dir): os.makedirs(dir) #獲取html頁面內容 url = 'http://tieba.baidu.com/p/5001852004?red_tag=t2336655710' cont = getHtml(url) #下載圖片 getImg(cont, 'image')