爬蟲之煎蛋網妹子圖大爬哦

阿新 • • 發佈：2019-01-26

ima 應該 h+ pan class net 處理 num close

今天為了測試一下urllib2模塊中的headers部分，也就是模擬客戶端登陸的那個東東，就對煎蛋網妹子圖練了一下手，感覺還可以吧。分享一下！

代碼如下

# coding:UTF-8

import urllib2,urllib,re,random


def getHtml(url) :
    request = urllib2.Request(url,headers=headers)
    response = urllib2.urlopen(request)
    page = response.read()
    return page

def getImageUrls(page) 
:
    reg = r‘src="(.+?\.jpg)"‘
    imageReg = re.compile(reg)
    img_urls = re.findall(imageReg,page)
    return img_urls

# 根據給定的路徑，文件名，將指定的數據寫入到文件中
def writeToFile(path,name,data):
    file = open(path+name,‘wb‘)
    file.write(data)
    file.close()
    print name+" has been Writed Succeed!"

#writeToFile(path,str(name)+".jpg",content) 

def downloadImages(images_url) :
    for i, item in enumerate(images_url):
        everypicture = getHtml(item)
        # 此處下載之後的文件使用了item來命名是為了避免圖片的覆蓋
        writeToFile(path, str(i+random.randint(1,100000000)) + ".jpg", everypicture)


# -------------------------------------------------------------------------------------------------- 

# 下面是我們的測試代碼
headers = {
    ‘referer‘:‘http://jandan.net/ooxx/page-1986‘,
    ‘User-Agent‘:‘Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.94 Safari/537.36‘
}

path = "F:\\pachong\\jiandan\\"
# 註意這裏的URL不是全部，按理應該使用url拼接自動完成的，但是我這裏是手動修改的
originalurl = ‘http://jandan.net/ooxx/page-1986‘
page = getHtml(originalurl)
images_url = getImageUrls(page)
downloadImages(images_url)

爬蟲結果

技術分享圖片

總結

代碼不多，核心在於思想。邏輯如下：

使用headers繞開網站的驗證
獲得主頁面中所有的圖片的url
根據圖片url循環的讀取網頁內容
再循環中就把圖片寫入到本地

是不是很簡單呢，但是這裏有不智能的地方，那就是沒有把原始的url做處理，如果再用url拼接技術的話，我們就可以實現“只需要一張網址，就可以抓取我們想要的所有的圖片了”。

代碼中不可避免的存在一些問題，歡迎大家批評指正！

再分享一下我老師大神的人工智能教程吧。零基礎！通俗易懂！風趣幽默！還帶黃段子！希望你也加入到我們人工智能的隊伍中來！https://blog.csdn.net/jiangjunshow

爬蟲之煎蛋網妹子圖大爬哦

ima 應該 h+ pan class net 處理 num close 今天為了測試一下urllib2模塊中的headers部分，也就是模擬客戶端登陸的那個東東，就對煎蛋網妹子圖練了一下手，感覺還可以吧。分享一下！代碼如下 # coding:UTF-8 impor

python爬蟲--下載煎蛋網妹子圖到本地

eve 元素 download down find .get fault log arc 1 #coding:utf-8 2 """ 3 下載煎蛋妹子到本地，通過selenium、正則表達式、phantomjs、Beautifulsoup實現 4 """ 5

Python爬蟲之爬取煎蛋網妹子圖

創建目錄 req add 註意 not 相同 esp mpi python3 這篇文章通過簡單的Python爬蟲（未使用框架，僅供娛樂）獲取並下載煎蛋網妹子圖指定頁面或全部圖片，並將圖片下載到磁盤。首先導入模塊：urllib.request、re、os import

python 爬蟲爬取煎蛋網妹子圖

前言大家好，這裡是「Python知識圈」爬蟲系列教程。此文首發於「brucepk」公眾號，歡迎大家去關注。此係列教程以例項專案為材料進行分析，從專案中學習 python 爬蟲，跟著我一起學習，每天進步一點點。煎蛋網站煎蛋網.png 很多朋友都反應學 pyt

Python Scrapy 煎蛋網妹子圖例項

前面介紹了爬蟲框架的一個例項，那個比較簡單，這裡在介紹一個例項爬取煎蛋網妹子圖，遺憾的是上週煎蛋網還有妹子圖了，但是這周妹子圖變成了隨手拍，不過沒關係，我們爬圖的目的是為了加強實戰應用，管他什麼圖了先爬下來再說。言歸正傳這個例項，主要是講將圖片爬了下來，儲存到本地，這個

python爬取煎蛋網妹子圖，已解密圖片~~~~~

本來想爬一波無聊圖，唉，竟然加密了。。。。還好是base64 不說了，程式碼獻上 2018.12.14 有效。。。。。 import requests from bs4 import BeautifulSoup import base64,time base64_l

Python爬蟲(6):煎蛋網全站妹子圖爬蟲

上一篇文章中我們抓取了豆瓣圖書的資料，如果大家執行成功，並且看到資料夾下的 txt 檔案了。是不是有一種剛接觸程式設計，第一次輸出Hello world!時的欣喜。和上一篇實踐不同，我們這一次來爬取煎蛋網全站妹子圖，並且儲存到指定資料夾下。爬取流程從煎蛋網妹子圖第一頁開始抓取；爬取分頁標籤獲得最後一頁數字

python 爬取煎蛋ooxx妹子圖

煎蛋網妹子圖首頁（http://jandan.net/ooxx），這個連結看起來怎麼那麼邪惡呢？經分析網站隱藏了圖片地址。心一橫，採取曲線路線，成功爬取大量妹子圖~ 原始碼如下： 1 import requests 2 import re 3 import os 4 import base6

Python爬蟲入門教程 2-100 妹子圖網站爬取

字典註意 while import 我們分鐘基礎便是訪問前言從今天開始就要擼起袖子，直接寫Python爬蟲了，學習語言最好的辦法就是有目的的進行，所以，接下來我將用10+篇的博客，寫爬圖片這一件事情。希望可以做好。為了寫好爬蟲，我們需要準備一個火狐瀏覽器，還

python爬蟲之雲片網國內簡訊介面爬取

安裝requests，lxml，openpyxl，pandas四個包。 requests爬取 lxml解析 panda轉換並儲存 openpyxl是讀寫excel檔案所用到的包程式碼奉上： import pandas as pandas import requests from lxm

Python爬蟲入門教程，突破煎蛋網反爬措施，妹子圖批量抓取！

今天寫一個爬蟲愛好者特別喜歡的網站煎蛋網，這個網站其實還是有點意思的，網站很多人寫了N多的教程了，各種方式的都有，當然網站本身在爬蟲愛好者的不斷進攻下，也在不斷的完善，反爬措施也很多，今天我用 selenium 在揍他一波。

python3 15行程式碼爬取煎蛋網大圖(原圖)--基礎逆向破解js-------------------玉米都督

如果您覺得我的文章對您有用,請您給我一個關注,您的每一個關注都是對我極大的支援,我也會極大的提高產出效率,To_share_code 做爬蟲基本功就是逆向js, ps: 其實沒必要關心js函式的內部細節，只要找到函式的輸入輸出點就可以了。萬變不離其宗，只要在輸入、輸出的地方下斷點，

煎蛋網爬蟲之JS逆向解析img路徑

ces param 得到 exception res lex image pytho pool 圖片使用js onload事件加載 <p><img src="//img.jandan.net/img/blank.gif" onload="jandan_lo

python爬蟲之反爬蟲情況下的煎蛋網圖片爬取初步探索

本次爬蟲網址：http://jandan.net/ooxx 前言：前段時間一直在折騰基於qqbot的QQ機器人，昨天用itchat在微信上也寫了一個機器人，相比webqq，微信的web端功能比較豐富，圖片、檔案等都可以傳輸。今天閒來無事準備給寫個爬蟲豐富微信機器

用python來抓取“煎蛋網”上面的美女圖片，尺度很大哦！哈哈

each file like http add 寫入 header 。。 num 廢話不多說，先上代碼： import urllib.request import re #獲得當前頁面的頁數page_name def get_pagenum(url): req

python3爬蟲爬取煎蛋網妹紙圖片

port 商業技術分享爬取其中 lar c函數 base 技術其實之前實現過這個功能，是使用selenium模擬瀏覽器頁面點擊來完成的，但是效率實際上相對來說較低。本次以解密參數來完成爬取的過程。首先打開煎蛋網http://jandan.net/ooxx，查看網頁

Python3 Scrapy框架學習三：爬取煎蛋網加密妹子圖片(全爬)

以下操作基於Windows平臺。開啟CMD命令提示框：新建一個專案如下：開啟專案裡的setting檔案，新增如下程式碼 IMAGES_STORE = './XXOO' #在當前目錄下新建一個XXOO資料夾 MAX_PAGE = 40 #定義爬取的總得頁數

Python爬蟲入門教程 18-100 煎蛋網XXOO圖片抓取

寫在前面很高興我這系列的文章寫道第18篇了，今天寫一個爬蟲愛好者特別喜歡的網站煎蛋網http://jandan.net/ooxx，這個網站其實還是有點意思的，網站很多人寫了N多的教程了，各種方式的都有，當然網站本身在爬蟲愛好者的不斷進攻下，也在不斷的完善，反爬措施也很多，今天我用selenium在揍他一波

爬蟲之刃----趕集網招聘類爬取案例詳解(系列四)

前言本篇承襲之前的系列文章，開始動真格。以趕集網招聘類資訊爬取為例，詳細解說爬蟲程式構建過程。準備工作：閱讀之前的系列一、系列二、系列三，有一定遞進關係登陸趕集網，瞭解下“地形” OK，let’s go！構建URL庫

網路爬蟲筆記（Day6）——妹子圖

利用多程序爬取妹子圖：http://www.mzitu.com 完整程式碼如下：程序，參看博文程序和執行緒——Python中的實現 import requests from lxml import etree import os import mul

爬蟲之煎蛋網妹子圖 大爬哦

代碼如下

爬蟲結果

總結

相關推薦

爬蟲之煎蛋網妹子圖大爬哦