爬取妹子圖片

阿新 • • 發佈：2018-11-08

[] 爬取 user pict html pen chdir star download

學習練習爬蟲的時候寫了一個爬取妹子的小程序玩玩。

from bs4 import BeautifulSoup
import requests
import os
from threading import Thread

‘‘‘
    soup.find( name , attrs , recursive , string , **kwargs )函數
        name:查找哪一個標簽
        attrs：標簽裏的指定那個參數，比如class
    註意：
        BeautifulSoup()返回的類型是<class ‘bs4.BeautifulSoup‘>
        find()返回的類型是<class ‘bs4.element.Tag‘>
        find_all()返回的類型是<class ‘bs4.element.ResultSet‘>
        <class ‘bs4.element.ResultSet‘>不能再進行find/find_all操作
 
‘‘‘
def first_page(url):
    ‘‘‘
        從主頁的圖片鏈接進去匹配
        http://www.mzitu.com/155036
        http://www.mzitu.com/155036/2
        找到最大頁數，循環訪問
    ‘‘‘
    headers = {
            ‘UserAgent‘: ‘Mozilla/5.0 (Windows NT 6.1 rv: 2.0.1) Gecko/20100101 Firefox/4.0.1‘,
    } 
    html = requests.get(url,headers=headers)
    soup  
= BeautifulSoup(html.text,‘html.parser‘)
    girl_url_list = soup.find(‘div‘,class_=‘main-image‘).find_all(‘a‘)[‘href‘]
    #最大頁數
    pic_max = soup.find_all(‘span‘)[10].text
    #圖片標題,soup對象
    title = soup.find(‘h2‘,class_=‘main-title‘).text
    pic_urls = []
    for i in range(1,int(pic_max)+1):
        pic_url  
= url +‘/‘+ str(i)
        pic_urls.append(pic_url)
    return pic_urls,title

def get_link(url):
    ‘‘‘
        從上層的http://www.mzitu.com/155036/2鏈接中匹配到圖片鏈接
        http://i.meizitu.net/2018/10/18b01.jpg
    ‘‘‘
    headers = {
            ‘UserAgent‘: ‘Mozilla/5.0 (Windows NT 6.1 rv: 2.0.1) Gecko/20100101 Firefox/4.0.1‘,
    } 
    link_dict = {}
    res = first_page(url)
    print(res)
    for pic_url in res[0]:
        html = requests.get(pic_url, headers=headers)
        mess = BeautifulSoup(html.text,‘html.parser‘)
        link = mess.find(‘img‘, alt=res[-1])[‘src‘]  # link為<class ‘bs4.element.Tag‘>對象
        pic_name =  link.split(‘/‘)[-1]
        link_dict[link] = pic_name
    return link_dict

def download(url):
    ‘‘‘
        從圖片地址下載圖片
    ‘‘‘
    link_dict = get_link(url)
    for link in link_dict:
        headers = {
            ‘UserAgent‘: ‘Mozilla/5.0 (Windows NT 6.1 rv: 2.0.1) Gecko/20100101 Firefox/4.0.1‘,
            ‘Referer‘:link #由於網站有防盜鏈，所以要告訴服務器我是從哪個頁面鏈接過來的
        }
        html = requests.get(link,headers=headers)
        os.chdir(‘C:/Users/asus/Desktop/code/9.爬蟲/簡單web爬蟲/picture‘) #選擇保存文件夾
        with open(link_dict[link],‘wb‘) as fp:
            fp.write(html.content)
        
if __name__ == ‘__main__‘:
　　#這裏的圖片主頁鏈接由於沒爬取，先手動添加，有點low。。。
    urls = [‘http://www.mzitu.com/47580‘,‘http://www.mzitu.com/108003‘,‘http://www.mzitu.com/48342‘]

　　for url in urls:
        t = Thread(target=download,args=(url,)) #開啟線程爬取
        t_list.append(t)
　　for t in t_list:
        t.start()
　　for t in t_list:
        t.join()

爬取妹子圖片

[] 爬取 user pict html pen chdir star download 學習練習爬蟲的時候寫了一個爬取妹子的小程序玩玩。 from bs4 import BeautifulSoup import requests import os from threa

Python使用BeautifulSoup簡單實現爬取妹子mm圖片--初級篇

先來個效果截圖（屈服在我的淫威之下吧！壞壞...嘿0.0）因為是簡易版而且是自己寫著玩玩而已，自己也剛學，亦是筆記亦是分享，大佬輕噴就好。主要目的是希望更多人能夠體驗爬取一些seqing圖片的快樂？？哈哈完整程式碼：文末已貼出應該安裝個bs4的包就可

Python爬取妹子網圖片

提取文章標題 import requests from bs4 import BeautifulSoup url = 'http://www.mzitu.com/26685' header = {'User-Agent': 'Mozilla/5.0 (

一個鹹魚的Python爬蟲之路（三）：爬取網頁圖片

you os.path odin 路徑生成存在 parent lose exist 學完Requests庫與Beautifulsoup庫我們今天來實戰一波，爬取網頁圖片。依照現在所學只能爬取圖片在html頁面的而不能爬取由JavaScript生成的圖。所以我找了這個網站

python爬取網頁圖片

ima com col list https pytho 表達式 images 5% 在Python中使用正則表達式，一個小小的爬蟲，抓取百科詞條網頁的jpg圖片。下面就是我的代碼，作為參考： #coding=utf-8 # __author__ = ‘Hinfa‘ im

簡單的爬取網頁圖片

baidu alt idt ima 修改利用表達輸入 html import reimport urllib.request# ------ 獲取網頁源代碼的方法 ---def getHtml(url): page = urllib.request.urlope

Python協程爬取妹子圖(內有福利，你懂得~)

split 基本保存文件切換代碼執行怎麽辦什麽 head .cn 項目說明：　　1、項目介紹　　　本項目使用Python提供的協程+scrapy中的選擇器的使用(相當好用)實現爬取妹子圖的(福利圖)圖片，這個學會了，某榴什麽的、pow(2, 10)是吧！

Python 爬取美女圖片，分目錄多級存儲

port Language resp pac rst apt itl album domain 最近有個需求：下載https://mm.meiji2.com/網站的圖片。所以簡單研究了一下爬蟲。在此整理一下結果，一為自己記錄，二給後人一些方向。爬取結果如圖：

練習-爬取某圖片及查詢IP地址

AI for AR 信息 enc 查詢 ext text 建立爬取某圖片的程序： #圖片爬取全代碼 import requests import os url=‘http://img0.dili360.com/rw9/ga/M01/4A/3D/wKgBy1p6qJ6AL

爬取動態圖片—以百度圖片為例

python爬蟲；人工智能一：何謂動態加載圖片所謂動態加載圖片即指html剛加載時，圖片時沒有的，然後通過json發生有關圖片的數據，在插入到html裏面去，以到底快速打開網頁的目的，那麽問題來了？我們如何找到加載文件的json文件呢?而這個問題正是我們實現爬取百度圖片的第一步，讓小可愛告訴你怎麽做吧

python3爬取女神圖片，破解盜鏈問題

什麽 agen lock 基本 avi rt thread agent 使用 icm title: python3爬取女神圖片，破解盜鏈問題 date: 2018-04-22 08:26:00 tags: [python3,美女,圖片抓取，爬蟲，盜鏈] comments

網絡爬蟲（爬取網站圖片，自動保存本地）

accep RoCE itl mage pytho range @class == title 事先申明一點，這個人品沒有什麽問題，只是朋友發一段python源碼，再這裏分享大家。 1 import requests 2 from lxml import html

思路——根據網站鏈接爬取整個圖片網站

requests 方式效率 java實現 rap html 進行 os模塊 pat 八月入職新公司，發現公司的爬蟲系統主要用Java實現的偶爾用一些python，為此又看了下Java爬蟲，順便用之前同事推薦我的美女圖片網站練手（之前推薦時候python爬蟲勉強算經

Scrapy:虎牙爬取，圖片存儲與數據分析

alt 數據分析 mage 加載 ram data afr frame bubuko 第一次爬取虎牙主播數據，有點小激動 1.共批量爬取的101個主播的，包括頭像主播名字房間號房間鏈接 2.數據規整部分，需要將json數據加載到pandas的Dataframe，

批量爬取某圖片網站的圖片

批量爬取某圖片網站的圖片宣告：僅用於爬蟲學習，禁止用於商業用途謀取利益 1、網頁解析（1）開啟veer首頁，F12(谷歌瀏覽器)，輸入關鍵字，點選搜尋，點選檢視如圖畫圈位置（2）檢視search中的Headers，找到請求的URL和請求的paylo

Python 爬蟲入門之爬取妹子圖

Python 爬蟲入門之爬取妹子圖來源：李英傑連結： https://segmentfault.com/a/1190000015798452 聽說你寫程式碼沒動力？本文就給你動力，爬取妹子圖。如果這也沒動力那就沒救了。 GitHub 地址:&

Day11 (黑客成長日記) 爬取網站圖片

#匯入第三方庫# coding:utf-8import requests,re#找到需要爬取的網站'http://www.qqjia.com/sucai/sucai1210.htm'#1>獲取網站 2>正則表示式匹配不同圖片的地址 3>找到所有圖片的URL#開發講究見名識意#1.1 定

簡單爬蟲之爬取網站圖片

這裡選取的網址是 http://www.doutula.com 目的：爬取其中的圖片並且翻頁爬取首頁圖片的規則 <img src="https://ws3.sinaimg.cn/bmiddle/6af89bc8gw1f

聰哥哥教你學Python之如何爬取美女圖片

今天要講的是Python。Python目前主要是在人工智慧和資料分析上比較火。這裡我們就講它的資料分析。什麼叫資料分析呢？簡單地說，根據已知資料，經過分析，得出結論。這就叫做資料分析。今天聰哥哥我拿一個簡單的爬蟲例項，教你爬取美女圖片，不過在此之前聰哥哥我得說說一些雜七雜八的。這個

requests與BeautifulSoup爬取網頁圖片

requests+BeautifulSoup爬取網頁圖片最近一直抽時間在看requests+BeautifulSoup爬取網頁內容這一塊的內容，所以，打算把自己看的總結一下，分享也是一種學醫，給自己做做筆記。 1.首先，我們看一下requests庫 requests

爬取妹子圖片

相關推薦