妹子圖爬蟲..新手的爬蟲

阿新 • • 發佈：2018-10-31

import re
import urllib.request


def open_url(url):
    req = urllib.request.Request(url)
    req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36')
    page = urllib.request.urlopen(req)
    html = page.read().decode('utf-8')
    return html


def get_img(html):
    ###搜尋圖片地址
    p = r'<img src="([^"]+\.jpg)'
    imglist = re.findall(p,html)
    ###去除最後一個地址是最後一個地址與我們找到圖片無關，而且多次試驗中最後一張圖片的地址會出錯所以需要刪除
    imglist.pop()
    """
    for i in imglist:
        print(i)
    """
    ###下載圖片
    for each in imglist:
          each = 'https:'+each
          print(each)
          filename = each.split("/")[-1]
          urllib.request.urlretrieve(each,filename,None)
    print('圖片下載完成！！！！')
def get_Ye(html):
    ###獲取當前頁數
    p=r'<span class="current-comment-page">\[(.+)]'
    imglist=re.findall(p,html)
    return imglist[0]
if __name__ == '__main__':
    
    FirstUrl = 'http://jandan.net/ooxx'
    NowYe = int(get_Ye(open_url(FirstUrl)))
    print('當前頁數為：%d'%NowYe)
    
    while True:
        Ywant = int(input('請輸入你想下載的頁數:'))
        if Ywant<=NowYe and Ywant >0:  
            for i in range(Ywant):
                print
                url = 'http://jandan.net/ooxx/page-'+str(NowYe-i)+'#comments'
                get_img(open_url(url))
            break    


        else:
            print('請重新輸入頁數：範圍在【%d,0)中'%NowYe)

妹子圖爬蟲..新手的爬蟲

import re import urllib.request def open_url(url): req = urllib.request.Request(url) req.add_header('User-Agent','Mozilla/5.0 (Windows NT

小白爬蟲第一彈之抓取妹子圖【更新版】

mozilla dir mac print 1.0 bsp 實例化 com def 最近對爬蟲感興趣，參考了 http://cuiqingcai.com/3179.html 這篇文章，琢磨的小試身手，但是按照原文發現圖片下載下來全是打不開的圖片，這不是我想要的啊，嘗試

Python爬蟲之爬取煎蛋網妹子圖

創建目錄 req add 註意 not 相同 esp mpi python3 這篇文章通過簡單的Python爬蟲（未使用框架，僅供娛樂）獲取並下載煎蛋網妹子圖指定頁面或全部圖片，並將圖片下載到磁盤。首先導入模塊：urllib.request、re、os import

python爬蟲--下載煎蛋網妹子圖到本地

eve 元素 download down find .get fault log arc 1 #coding:utf-8 2 """ 3 下載煎蛋妹子到本地，通過selenium、正則表達式、phantomjs、Beautifulsoup實現 4 """ 5

Python爬蟲新手進階版：怎樣讀取非結構化、圖像、視頻、語音數據

image clas 訓練在線的功能方式 base64編碼 contain width 通過open讀取之後會返回一個圖像文件對象，後續所有的圖像處理都基於該對象進行。上述代碼執行後，通過 img.show() 會調用系統默認的圖像瀏覽器查看打

網路爬蟲筆記（Day6）——妹子圖

利用多程序爬取妹子圖：http://www.mzitu.com 完整程式碼如下：程序，參看博文程序和執行緒——Python中的實現 import requests from lxml import etree import os import mul

Python 爬蟲入門之爬取妹子圖

Python 爬蟲入門之爬取妹子圖來源：李英傑連結： https://segmentfault.com/a/1190000015798452 聽說你寫程式碼沒動力？本文就給你動力，爬取妹子圖。如果這也沒動力那就沒救了。 GitHub 地址:&

福利爬蟲妹子圖

# -*- coding: utf-8 -*- # @Time : 2018/11/16 6:00 PM # @Author : cxa # @File : a.py # @Software: PyCharm # !/usr/bin/env python # import logging import os

Python爬蟲入門教程 2-100 妹子圖網站爬取

字典註意 while import 我們分鐘基礎便是訪問前言從今天開始就要擼起袖子，直接寫Python爬蟲了，學習語言最好的辦法就是有目的的進行，所以，接下來我將用10+篇的博客，寫爬圖片這一件事情。希望可以做好。為了寫好爬蟲，我們需要準備一個火狐瀏覽器，還

Python爬蟲-抓取divnil動漫妹子圖

目標網站 https://divnil.com 首先看看這網站是怎樣載入資料的; 開啟網站後發現底部有下一頁的按鈕，ok，爬這個網站就很簡單了; 學習Python中有不明白推薦加入交流群

Python3爬蟲系列：理論+實驗+爬取妹子圖實戰

爬蟲系列： (1) 理論 (2) 實驗 (3) 實戰 1. 準備環境 1.1 安裝CentOS 1.2 安裝Python3 1.3 安裝MongoDB 嘗試使用motor實現

萌新爬蟲的動力就是爬取妹子圖！批量爬取妹子圖喲！

進群：960410445 即可獲取原始碼！目錄前言 Media Pipeline 啟用Media Pipeline 使用 ImgPipeline 抓取妹子圖瞎比比與送書後話前言我們在抓取資料的過程中，除了要抓取

Python爬蟲入門教程，突破煎蛋網反爬措施，妹子圖批量抓取！

今天寫一個爬蟲愛好者特別喜歡的網站煎蛋網，這個網站其實還是有點意思的，網站很多人寫了N多的教程了，各種方式的都有，當然網站本身在爬蟲愛好者的不斷進攻下，也在不斷的完善，反爬措施也很多，今天我用 selenium 在揍他一波。

給Python3爬蟲做一個介面.妹子圖網實戰 3

給Python爬蟲做一個介面.成品一、實驗簡介 1.1 實驗內容通過 PyQt 給妹子圖網的Python爬蟲做一個互動介面，從而對 PyQt 有初步的理解，並學會如何使用 Qt Creater 做介面以及實現基礎功能。課程分為三個部分：瞭解如何將 Qt Cre

給Python3爬蟲做一個介面妹子圖網實戰 1

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

給Python3爬蟲做一個介面妹子圖網實戰 3

爬蟲之煎蛋網妹子圖大爬哦

ima 應該 h+ pan class net 處理 num close 今天為了測試一下urllib2模塊中的headers部分，也就是模擬客戶端登陸的那個東東，就對煎蛋網妹子圖練了一下手，感覺還可以吧。分享一下！代碼如下 # coding:UTF-8 impor

Python爬蟲——利用requests模組爬取妹子圖

近期學了下python爬蟲，利用requests模組爬取了妹子圖上的圖片，給單身狗們發波福利，哈哈！順便記錄一下第一次發部落格。話不多說，進入正題開發環境 python 3.6 涉及到的庫 requests lxml 先上一波爬取的截圖

python——圖片爬蟲：爬取愛女神網站(www.znzhi.net)上的妹子圖進階篇

我講解了圖片爬蟲的基本步驟，並實現了爬蟲程式碼在本篇中，我將帶領大家對基礎篇中的程式碼進行改善，加入多執行緒，提高爬取效率。首先我們明確一個改進的思路，就是在函式downloadAlbum(url)中： # 迴圈下載專輯中各個圖片 for num in

python 爬蟲爬取煎蛋網妹子圖

前言大家好，這裡是「Python知識圈」爬蟲系列教程。此文首發於「brucepk」公眾號，歡迎大家去關注。此係列教程以例項專案為材料進行分析，從專案中學習 python 爬蟲，跟著我一起學習，每天進步一點點。煎蛋網站煎蛋網.png 很多朋友都反應學 pyt

妹子圖爬蟲..新手的爬蟲

相關推薦