python爬蟲：爬取某牙直播小姐姐圖片，我的雙手已經按捺不住了

阿新 • • 發佈：2020-12-23

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

( 想要學習Python？Python學習交流群：1039649593，滿足你的需求，資料都已經上傳群檔案流，可以自行下載！還有海量最新2020python學習資料。 )

一、前言

某牙平臺，直播界的先驅，有很多主播會把一些自己的直播精彩圖片上傳作為桌布，今天我們就把這些小姐姐圖片全部爬取下來。

二、爬蟲案例一般步驟(思路):

1．使用python建立一個資料夾
2．模擬瀏覽器
3．使用requests去進行http請求,並且拿到網頁原始資料
4．對原始資料進行篩選
5．下載

三、所用到得庫

eimport os#下載包
import urllib.request#爬蟲庫
import requests#網頁選擇器
from bs4 import BeautifulSoup

1．使用python建立一個資料夾

# 1.
if not os.path.exists('./虎牙主播圖片/'):
os.mkdir('./虎牙主播圖片/‘)

建立一個資料夾方便儲存爬取下來的圖片。

2．模擬瀏覽器
搜尋某牙網頁按F12找到network，再下面隨便找一個連結，再找到User-Agent，全部複製下來，如下圖所示

注意：複製下來之後在pycharm建立一個請求頭，當爬蟲程式向網站傳送請求時網站需要檢測當前請求是否為瀏覽器發出的。

headers={
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36}

3．使用requests去進行http請求,並且拿到網頁原始資料

url = 'https://www.huya.com/g/2168'
response = requests.get(url).text
soup = BeautifulSoup(response, 'lxml')

還去到原視資料在進一步篩選

4．對原始資料進行篩選和下載

girls = soup.find_all('img', class_='pic')
for girl in girls:
    girl_url = girl['data-original'].split('?')[0]
    girl_title = girl['title']
    print(girl_url, girl_title)

爬取結果

python爬蟲：爬取某牙直播小姐姐圖片，我的雙手已經按捺不住了

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

python爬蟲：爬取某圖外賣資料有這篇文章就夠了

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

python爬蟲：爬取窮遊網的地點資料，世界那麼大，我想去看看。

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

Python爬蟲：爬取科技新聞，進而整理，產出資料分析

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

Python爬蟲：爬取喜馬拉雅音訊資料詳解

前言喜馬拉雅是專業的音訊分享平臺，彙集了有聲小說,有聲讀物,有聲書,FM電臺,兒童睡前故事,相聲小品,鬼故事等數億條音訊，我最喜歡聽民間故事和德雲社相聲集，你呢？

Python爬蟲：爬取無賬號無限制獲取企查查資訊

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

Python爬蟲例項——爬取美團美食資料

1.分析美團美食網頁的url引數構成 1）搜尋要點美團美食，地址：北京，搜尋關鍵詞：火鍋

python爬蟲：抓取下載電影檔案，合併ts檔案為完整視訊

目標網站：https://www.88ys.cc/vod-play-id-58547-src-1-num-1.html 反貪風暴4 對電影進行分析

Python爬蟲之爬取淘女郎照片示例詳解

本篇目標抓取淘寶MM的姓名，頭像，年齡抓取每一個MM的資料簡介以及寫真圖片

[python][爬蟲]批量爬取【漫畫DB】的漫畫圖片

今天看漫畫的時候感覺用瀏覽器實在不爽，就寫個小程式爬了下來。順便安利一個漫畫軟體MComix，超級好用（Linux限定，Win可以用ComicViewer）

python爬蟲實戰---爬取大眾點評評論

python爬蟲實戰—爬取大眾點評評論（加密字型） 1.首先開啟一個店鋪找到評論

python爬蟲實踐爬取今日頭條街拍圖（參考了python3webspider和github上的程式碼）

import requests from urllib.parse import urlencode from requests import codes import os from hashlib import md5

python例項：爬取caoliu圖片，同時下載到指定的資料夾內

本指令碼主要實現爬取caoliu某圖片板塊，前3頁當天更新的帖子的所有圖片，同時把圖片下載到對應帖子名建立的資料夾中

Python爬蟲：抓取智聯招聘崗位資訊和要求（基礎版）

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

Python爬蟲：抓取智聯招聘崗位資訊和要求（進階版）

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

python分析：爬取《靈籠》這部國產動漫彈幕，分析詞雲！看看網友究竟在說啥？

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

Python 爬蟲批量爬取網頁圖片儲存到本地的實現程式碼

其實和爬取普通資料本質一樣，不過我們直接爬取資料會直接返回，爬取圖片需要處理成二進位制資料儲存成圖片格式（.jpg,.png等）的資料文字。

python爬蟲實現爬取同一個網站的多頁資料的例項講解

對於一個網站的圖片、文字音視訊等，如果我們一個個的下載，不僅浪費時間，而且很容易出錯。Python爬蟲幫助我們獲取需要的資料，這個資料是可以快速批量的獲取。本文小編帶領大家通過python爬蟲獲取獲取總頁數並更改

python協程爬取某網站的老賴資料

import re import json import aiohttp import asyncio import time import pymysql from asyncio.locks import Semaphore

python爬蟲實現爬取網頁主頁資訊（html程式碼）

技術標籤：pythonweb python爬蟲實現爬取網頁主頁資訊（html程式碼） 1.爬取網站原始碼

python爬蟲：爬取某牙直播小姐姐圖片，我的雙手已經按捺不住了

一、前言

二、爬蟲案例一般步驟(思路):

三、所用到得庫

相關推薦