Python爬蟲，爬取網站圖片，詳細解釋（看完就會）

阿新 • • 發佈：2021-06-22

Xpath

解析圖片專案

# 指定url
url = 'http://pic.netbian.com/4kyingshi/'
# UA偽裝
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                  'Chrome/91.0.4472.101 Safari/537.36 Edg/91.0.864.48 '
}
# 傳送請求
response = requests.get(url=url, headers=headers)
 
# 獲取頁面文字資訊
page_text = response.text
# 獲取編碼格式
print(response.encoding)
# 解析返回來的內容
tree = etree.HTML(page_text)
# 編寫匹配規則
# Xpath規則:獲取所有節點下的div class屬性值為"slist" 該div下的/ul便籤下的/ul標籤
li_list = tree.xpath('//div[@class="slist"]/ul/li')
print(li_list)
# 開始遍歷獲取src屬性值
for li in li_list:
    # 拼接圖片url
    # Xpath規則:獲取當前目錄下的/a標籤下的img標籤選擇src屬性 

    img_url = 'http://pic.netbian.com'+li.xpath('./a/img/@src')[0]
    # Xpath規則:原理同上
    # 生成檔名
    img_name = li.xpath('./a/img/@alt')[0]
    # 編碼
    img_name_list = img_name.encode('iso-8859-1').decode('gbk')
    print(img_url, img_name_list)
    # 傳送二次請求，請求圖片的src值
    response_content = requests.get(url= img_url, headers=headers).content
     
# 持久化處理
    with open(img_name_list+'.jpg','wb') as fp:
        fp.write(response_content)

Python爬蟲，爬取網站圖片，詳細解釋（看完就會）

Xpath 解析圖片專案 # 指定url url = \'http://pic.netbian.com/4kyingshi/\' # UA偽裝 headers = { \'User-Agent\': \'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) \

python例項：爬取caoliu圖片，同時下載到指定的資料夾內

本指令碼主要實現爬取caoliu某圖片板塊，前3頁當天更新的帖子的所有圖片，同時把圖片下載到對應帖子名建立的資料夾中

Python爬蟲：爬取科技新聞，進而整理，產出資料分析

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

Python 爬蟲批量爬取網頁圖片儲存到本地的實現程式碼

其實和爬取普通資料本質一樣，不過我們直接爬取資料會直接返回，爬取圖片需要處理成二進位制資料儲存成圖片格式（.jpg,.png等）的資料文字。

python爬蟲實踐爬取今日頭條街拍圖（參考了python3webspider和github上的程式碼）

import requests from urllib.parse import urlencode from requests import codes import os from hashlib import md5

【Python爬蟲】入門級爬蟲案例，20行程式碼爬取網站圖片（附原始碼）

知識點爬蟲的步驟 requests parsel xpath資料解析爬蟲四個步驟: 1.獲取網頁地址 (目標地址)2.傳送請求3.資料解析4.儲存本地

python爬蟲：爬取某牙直播小姐姐圖片，我的雙手已經按捺不住了

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

python爬蟲：爬取窮遊網的地點資料，世界那麼大，我想去看看。

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

[python][爬蟲]批量爬取【漫畫DB】的漫畫圖片

今天看漫畫的時候感覺用瀏覽器實在不爽，就寫個小程式爬了下來。順便安利一個漫畫軟體MComix，超級好用（Linux限定，Win可以用ComicViewer）

首頁和次頁地址不一致，爬取網站通訊錄

from pyquery import PyQuery as pq import requests import csv def get_env(url=\"http://localhost:8080/index.htm\", data=\"\", headers=\"\"):

python爬蟲實現爬取同一個網站的多頁資料的例項講解

對於一個網站的圖片、文字音視訊等，如果我們一個個的下載，不僅浪費時間，而且很容易出錯。Python爬蟲幫助我們獲取需要的資料，這個資料是可以快速批量的獲取。本文小編帶領大家通過python爬蟲獲取獲取總頁數並更改

Python爬蟲例項——爬取美團美食資料

1.分析美團美食網頁的url引數構成 1）搜尋要點美團美食，地址：北京，搜尋關鍵詞：火鍋

Python爬蟲之爬取淘女郎照片示例詳解

本篇目標抓取淘寶MM的姓名，頭像，年齡抓取每一個MM的資料簡介以及寫真圖片

python爬蟲實戰---爬取大眾點評評論

python爬蟲實戰—爬取大眾點評評論（加密字型） 1.首先開啟一個店鋪找到評論

通過Jsoup，爬取車輛品牌，車系，LOGO等

@Test public void test4() throws IOException { for (int i = 65; i <= 90; i++) { String value = String.valueOf((char) i);

Python爬蟲：爬取喜馬拉雅音訊資料詳解

前言喜馬拉雅是專業的音訊分享平臺，彙集了有聲小說,有聲讀物,有聲書,FM電臺,兒童睡前故事,相聲小品,鬼故事等數億條音訊，我最喜歡聽民間故事和德雲社相聲集，你呢？

python爬蟲：爬取某圖外賣資料有這篇文章就夠了

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

Python爬蟲：爬取無賬號無限制獲取企查查資訊

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

python爬蟲實現爬取網頁主頁資訊（html程式碼）

技術標籤：pythonweb python爬蟲實現爬取網頁主頁資訊（html程式碼） 1.爬取網站原始碼

爬取網站圖片並儲存到本地

技術標籤：爬蟲爬蟲正則表示式爬取網站圖片並儲存到本地第一步：模擬瀏覽器發出請求，獲取網頁資料