Python爬蟲實戰詳解：爬取圖片之家

阿新 • • 發佈：2020-11-04

前言

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

如何使用python去實現一個爬蟲？

模擬瀏覽器
請求並獲取網站資料
在原始資料中提取我們想要的資料資料篩選
將篩選完成的資料做儲存

完成一個爬蟲需要哪些工具

Python3.6
pycharm 專業版

目標網站

圖片之家

https://www.tupianzj.com/

爬蟲程式碼

匯入工具

python 自帶的標準庫

import ssl

系統庫自動建立儲存資料夾

import os

下載包

import urllib.request

網路庫第三方包

import requests

網頁選擇器

from bs4 import BeautifulSoup

預設請求https網站不需要證書認證

ssl._create_default_https_context = ssl._create_unverified_context

模擬瀏覽器

headers = {
    'User-Agent':
        'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36',
}

自動建立資料夾

if not os.path.exists('./插畫素材/'):
    os.mkdir('./插畫素材/')
else:
    pass

請求操作

url = 'https://www.tupianzj.com/meinv/mm/meizitu/'
html = requests.get(url, headers=headers).text

對頁面原始資料做資料提取

soup = BeautifulSoup(html, 'lxml')
images_data = soup.find('ul', class_='d1 ico3').find_all_next('li')
for 
 image in images_data:
    image_url = image.find_all('img')
    for _ in image_url:
        print(_['src'], _['alt'])

下載

try:
    urllib.request.urlretrieve(_['src'], './插畫素材/' + _['alt'] + '.jpg')
except:
    pass

效果圖

Python爬蟲實戰詳解：爬取圖片之家

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

Python爬蟲實戰，QQ音樂爬取全部歌曲

前景介紹最近小夥伴們聽歌的興趣大漲，網抑雲綜合症已經遍佈各地。咱們再來抬高一波QQ音樂的熱度吧。

python爬蟲實戰，超簡單爬取抖音無水印視訊

目錄一、抖音視訊分析二、分析複製的短連結三、分析返回的資料四、下載原始碼

Python爬蟲案例教學演示：爬取“絕對領域”二次元小姐姐圖片

Python爬蟲、資料分析、網站開發等案例教程視訊免費線上觀看 https://space.bilibili.com/523606542

Python爬蟲實戰入門六：提高爬蟲效率—併發爬取智聯招聘（轉載）

之前文章中所介紹的爬蟲都是對單個URL進行解析和爬取，url數量少不費時，但是如果我們需要爬取的網頁url有成千上萬或者更多，那怎麼辦？使用for迴圈對所有的url進行遍歷訪問？嗯，想法很好，但是如果url過多，爬取

Python爬蟲實現的根據分類爬取豆瓣電影資訊功能示例

本文例項講述了Python爬蟲實現的根據分類爬取豆瓣電影資訊功能。分享給大家供大家參考，具體如下：

Python爬蟲，京東商品詳情爬取！

最近因需求需要，需要到京東爬取一些類別的商品資訊。記錄下過程中踩過的坑，最後奉獻上全部程式碼。僅供互相學習，如有錯誤請指正~~

scrapy處理python爬蟲排程詳解

學習了簡單的知識點，就會想要向有難度的問題挑戰，這裡必須要誇一誇小夥伴們。不過我們今天不需要做什麼程式的測試，只用簡單的兩個程式碼對比，小夥伴們就能在其中體會兩者的不同和難易程度。scrapy能否適合處理py

python爬蟲學習（一）爬取高清桌布（各種主流大小的高清圖）

from bs4 import BeautifulSoup import requests import time import os def get_photo(key): url = \"https://desk.zol.com.cn/meinv/\"+str(key)+\".html\"

Python爬蟲實戰入門一：工具準備（轉載）

一、基礎知識使用Python編寫爬蟲，當然至少得了解Python基本的語法，瞭解：基本資料結構

Python爬蟲實戰入門二：從一個簡單的HTTP請求開始(轉載)

一、為什麼從HTTP請求開始無論我們通過瀏覽器開啟網站、訪問網頁，還是通過指令碼對URL網址進行訪問，本質上都是對HTTP伺服器的請求，瀏覽器上所呈現的、控制檯所顯示的都是HTTP伺服器對我們請求的響應。以開啟我

Python open()函式詳解：開啟指定檔案

在 Python 中，如果想要操作檔案，首先需要建立或者開啟指定的檔案，並建立一個檔案物件，而這些工作可以通過內建的 open() 函式實現。

python爬蟲-CrawlSpider的全站資料爬取

瞭解CrawlSpider CrawlSpider是Spider的子類它的建立方式是： scrapy genspider -t crawl spiderName www.xxx.com

資訊時代程式設計師輕鬆帶你爬取汽車之家資料

使用BeautifulSoup模組使用正則表示式使用到多執行緒爬取使用說明使用前請安裝BeauifulSoup執行程式後會在當前目錄下生成txt檔案,內容為json格式.如下所示:

爬取站長之家免費簡歷

爬取站長之家免費簡歷 import os import requests from lxml import etree dir_name = \'./簡歷模板\'

爬取汽車之家車型配置檔案

一、需求獲取指定品牌的所有車型配置資訊，並儲存到excel中。流程大致思路：

Python爬蟲實戰案例：取喜馬拉雅音訊資料詳解

前言喜馬拉雅是專業的音訊分享平臺，彙集了有聲小說,有聲讀物,有聲書,FM電臺,兒童睡前故事,相聲小品,鬼故事等數億條音訊，我最喜歡聽民間故事和德雲社相聲集，你呢？

Python爬蟲實戰案例之爬取喜馬拉雅音訊資料詳解

Python爬蟲：爬取喜馬拉雅音訊資料詳解

Python爬蟲實戰：爬取美團美食資料

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python爬蟲實戰詳解：爬取圖片之家

前言

爬蟲程式碼

相關推薦