python爬取網站上的圖片並儲存到本地

阿新 • • 發佈：2018-12-24

　　1.匯入需要的模組requests，BeautifulSoup，os（用於檔案讀寫）。

　　2.建立一個類，並初始化。

class BeautifulPicture:
    def __init__(self):  # 類的初始化操作
        self.headers = {
            # 給請求指定一個請求頭來模擬chrome瀏覽器
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64)'
                          ' AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
        self.web_url = 'url'  # 要訪問的網頁地址
        self.folder_path = 'E:\\1\\pic'  # 設定圖片要存放的檔案目錄

　　3.先請求圖片所在的網頁，返回網頁response

    def request(self, url):  # 返回網頁response
        r = requests.get(url, self.headers)  # 向目標url地址傳送get請求，返回一個response物件
        return r

　　呼叫request方法，print(r.text)就可以看到控制檯上print出的網頁原始碼了。

　　4.通過BeautifulSoup工具獲取需要抓取的img標籤，這裡根據不同的網頁佈局css選擇器也會有不同：

    def get_pic(self):
        r = self.request(self.web_url)
        all_item = BeautifulSoup(r.text, 'html.parser').select(".search_results > .item")
        for item in all_item:
            img = item.find('a').find('img')
            url = img['src']

　　此處，我是先抓取img所在的div（類名為item），再獲取div下的a連結下的img，網頁具體程式碼格式為

<div class="flex_grid credits search_results" style="margin:4px 14px 0 15px">        
    <div class="item" data-w="640" data-h="256">
        <a href="">
            <img srcset="" src="" alt="">
        </a>
    </div>
    ......
</div>

　　通過遍歷可以獲取所有圖片的連結。

　　5.獲取到圖片地址連結後，就可以下載圖片並儲存到本地了。那麼就需要確認初始化定義的資料夾是否存在，如果不存在，需要建立。

    def mkdir(self, path):  # 建立資料夾
        path = path.strip()
        is_exists = os.path.exists(path)
        if not is_exists:
            print('建立名字叫做', path, '的資料夾')
            os.makedirs(path)
            print('建立成功！')
        else:
            print(path, '資料夾已經存在了，不再建立')

　　6.接下來就可以儲存圖片了。

　　第四步操作，在get_pic方法中，獲取到所有圖片所在的div標籤後，先確保存放圖片的檔案下是否存在，呼叫方法

　　self.mkdir(self.folder_path) # 建立資料夾

　　os.chdir(self.folder_path) # 切換路徑至上面建立的資料夾

　　遍歷所有的div，根據url名中jpg/png的不同，決定儲存圖片的字尾名

        i = 1  # 後面用來給圖片命名
        for item in all_item:
            img = item.find('a').find('img')
            url = img['src']
            if url.count('jpg') > 0:
                self.save_img(url, str(i) + '.jpg')
            elif url.count('png') > 0:
                self.save_img(url, str(i) + '.png')
            i += 1

　　其中save_img方法為：

    def save_img(self, url, name):  # 儲存圖片
        img = self.request(url)
        f = open(name, 'ab')
        f.write(img.content)
        print(name, '檔案儲存成功！')
        f.close()

　　建立MyBeautifulPicture類的例項，呼叫get_pic方法，至此，儲存圖片到本地就可以實現了。

　　完整的get_pic方法為：

    def get_pic(self):
        r = self.request(self.web_url)
        all_item = BeautifulSoup(r.text, 'html.parser').select(".search_results > .item")
        self.mkdir(self.folder_path)  # 建立資料夾
        os.chdir(self.folder_path)  # 切換路徑至上面建立的資料夾
        i = 1  # 後面用來給圖片命名
        for item in all_item:
            img = item.find('a').find('img')
            url = img['src']
            # print(url)
            if url.count('jpg') > 0:
                self.save_img(url, str(i) + '.jpg')
            elif url.count('png') > 0:
                self.save_img(url, str(i) + '.png')
            i += 1

python爬取網站上的圖片並儲存到本地

　　1.匯入需要的模組requests，BeautifulSoup，os（用於檔案讀寫）。　　2.建立一個類，並初始化。 class BeautifulPicture: def __init__(self): # 類的初始化操作 self.headers = {

簡單的python爬取網頁字串內容並儲存

最近想試試python的爬蟲庫，就找了個只有字串的的網頁來爬取。網址如下：開啟後看到是一些歌名還有hash等資訊。按照hash|filename的方式存在檔案裡，先貼程式碼 #coding=utf-8 import urllib import re import

爬蟲03 爬取堆糖圖片並儲存到本地

# -*- coding: utf-8 -*- import urllib import urllib2 import re i=0 page = 1 url = 'http://www.duitan

Python爬蟲爬取網站上的圖片

[Python]如何簡單的爬取網站上的圖片。

為了熟練的運用協程，接下來的程式碼將用協程來實現。只是一個簡單的小demo。 import gevent import urllib.request import re from gevent import monkey monkey.patch_all() def

★ Python爬蟲 - 爬取網頁文字資訊並儲存（美文的爬取與儲存）

本篇文章所包含的主要內容：使用requests模組實現對網頁以字串的形式儲存使用open()、write()、close()函式實現檔案的開啟與寫入使用if() 條件語句對所需要的文字資訊進行過濾以形成一個專用提取函式 &n

python爬蟲由淺入深9---定向爬取股票資料資訊並儲存至本地檔案

技術路線：requests庫+bs4庫+re庫的整合使用目標：獲得上交所和深交所所有股票的名稱和交易資訊輸出：儲存至本地檔案可選資料網路有：新浪股票和百度股票，，通過檢視網頁原始碼可知，新浪股票的資料是通過javascript指令碼獲取的，故通過以上方式無法解析呃呃

利用Python爬取房產資料！並在地圖上顯示！Python乃蒂花之秀！

JiwuspiderSpider.py # -*- coding: utf-8 -*- from scrapy import Spider,Request import re from jiwu.items import JiwuItem clas

Python爬蟲之爬取知乎帖子並儲存到mysql（以及遇到問題和解決方法）

爬取問題標題並儲存到資料庫：程式碼： # coding=utf-8 import urllib import urllib2 import re import MySQLdb #co

使用Python爬取網站圖片

最終程式碼：import requests import json import urllib def getSogouImag(category,length,path): n = length cate = category imgs = requests.get('http://pic.sogou.co

Python爬蟲入門——2. 5 爬取鬥破蒼穹並儲存到本地TXT

話不多說，上程式碼： #匯入requests庫 import requests #匯入 re 庫 #匯入時間模組 import time import re #定義請求頭，請求頭可以使爬蟲偽裝成瀏覽器 headers = {'User-Agent': '

Python3.5：爬取網站上電影數據

x64 沒有 () nbsp 運行 lpar target __init__ doc 首先我們導入幾個pyhton3的庫: from urllib import requestimport urllibfrom html.parser import HTMLParser 在

利用python爬取點小圖片，滿足私欲(爬蟲)

.text write ret append jpg use download div pat import requestsimport reimport os,syslinks=[]titles=[] headers = { "User-Agent": "Mozi

python爬取微博圖片數據存到Mysql中遇到的各種坑python Mysql存儲圖片

字符轉義 process 程序 zha 有一個 utf-8 get ctime python3 本人長期出售超大量微博數據，並提供特定微博數據打包，Message to [email protected] 前言由於硬件等各種原因需要把大概

python爬取百度圖片代碼

python爬蟲；import json import itertools import urllib import requests import os import re import sys word=input("請輸入關鍵字：") path="./ok" if

Python 爬取qqmusic音樂url並批量下載

QQ col expr IE filename 代碼都是 sles () 　qqmusic上的音樂還是不少的，有些時候想要下載好聽的音樂，但有每次在網頁下載都是煩人的登錄什麽的。於是，來了個qqmusic的爬蟲。　　至少我覺得for循環爬蟲，最核心的應該就是找到待爬元

Python爬取網站美女照片

上次無意之中看到一個網站，裡面全是美女的照片，我就心想，哪天有時間了得把這網站的所有美女照片都得爬下來。今天有時間，寫了點程式碼，爬去了網站的所有照片。附上戰果！圖片實在是太多了，爬了一個多小時，還在爬.... 先附上所有的原始碼： # -*- coding: utf-8 -*-

Python 爬取百度圖片的高清原圖

# coding=utf-8 """ 爬取百度圖片的高清原圖 Author : MirrorMan Created : 2017-11-10 """ import re import urllib import os import requests de

Python爬取網頁的圖片資料

本案例是基於PyCharm開發的，也可以使用idea。在專案內新建一個python檔案TestCrawlers.py TestCrawlers.py # 匯入urllib下的request模組 import urllib.request # 匯入正則匹配包 import re

python爬取百度圖片---釋出exe小計編碼是個大坑

#*--coding:utf-8--* import requests import sitecustomize import os import sys reload(sys) sys.setdefaultencoding('utf-8') type=sys.getfilesystemencodi

python爬取網站上的圖片並儲存到本地

相關推薦