python3中aiohttp+asyncio 高效率爬取圖片例子，本地儲存

阿新 • • 發佈：2019-01-27

import asyncio
import aiohttp
import time
import random
import os
from lxml import etree

path='F:\\wuso\\'      #檔案儲存路徑
targe_url=[]            
for i in range(0,200):#total 178        建立任務連結
targe_url.append('https://wuso.me/forum-photos-{}.html'.format(i))

async def run(url):
    path='F:\\wuso\\'
headers={'Accept' 
:'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
 'Accept-Encoding':'gb2312,utf-8',
 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:57.0) Gecko/20100101 Firefox/57.0',
 'Accept-Language':'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
 'Connection':'Keep-alive'
}
    try:
        async with  
aiohttp.ClientSession() as session:
            aiohttp.Timeout(5)
            async with session.get(url,headers=headers) as response:
                res=await response.text()
                res=etree.HTML(res)
                fName=res.xpath("//div[@class='c cl']/a/@title")
                #print(fName)
 
fLink=res.xpath("//div[@class='c cl']/a/@href")
                for i in range(len(fName)):
                    async with session.get(fLink[i],headers=headers) as imgres:
                        t=await imgres.text()
                        t=etree.HTML(t)
                        imgLinks=t.xpath('//img/@zoomfile')
                        try:
                            if not os.path.exists(path+fName[i]):
                                os.makedirs(path+fName[i])
                            for link in imgLinks:
                                async with session.get('https://wuso.me/'+link,headers=headers) as img:
                                    try:
                                        imgcode=await img.read()
                                        try:
                                            with open(path+fName[i]+'\\'+link.split('/')[-1],'wb') as f:
                                                f.write(imgcode)
                                                f.close()
                                                print(link.split('/')[-1],'Saved')
                                        except:
                                            print('檔案建立失敗')
                                            pass
                                    except:
                                        print('二進位制檔案讀取失敗')
                                        pass
                        except:
                            print('Img儲存失敗')
                            pass
    except:
        print('response失敗*******************************************')
        pass
start=time.time()
loop=asyncio.get_event_loop()
tasks=[]
for u in targe_url:
    tasks.append(asyncio.ensure_future(run(u)))
loop.run_until_complete(asyncio.wait(tasks))
loop.close()
print('total {}pages,time cost:{}'.format(len(tasks),time.time()-start))

python3中aiohttp+asyncio 高效率爬取圖片例子，本地儲存

import asyncio import aiohttp import time import random import os from lxml import etree path='F:\\wuso\\' #檔案儲存路徑 targe_url=[]

用python3從網頁中爬取圖片下載到本地

前提：使用的python是python3版本，2和3還是有很大的區別的。 1、先找一個有圖片的網頁（這裡找到的是新浪：http://photo.sina.com.cn）。右鍵，選擇最後一個檢查，就可以看到網頁的原始碼。然後是圖片的都是在標籤（）中。 urllib

[python學習] 簡單爬取圖片站點圖庫中圖片

ctu while 要去文章 ava ges file cor nal 近期老師讓學習Python與維基百科相關的知識，無聊之中用Python簡單做了個爬取“遊訊網圖庫”中的圖片，由於每次點擊下一張感覺很浪費時間又繁瑣。主要分享的是怎樣爬取HTML

python3 爬取圖片

.com ret reg eve code Coding aid quest fin #coding=utf-8import urllib.requestimport redef getHtml(url): page = urllib.request.urlopen(

python3爬蟲-快速入門-爬取圖片和標題

瀏覽器 ebr tle path requests itl edi 大致應用直接上代碼，先來個爬取豆瓣圖片的，大致思路就是發送請求-得到響應數據-儲存數據，原理的話可以先看看這個 https://www.cnblogs.com/sss4/p/7809821.html

Python3.6實現scrapy框架爬取資料並將資料插入MySQL與存入文件中

# -*- coding: utf-8 -*- # Define your item pipelines here # # Don't forget to add your pipeline to the ITEM_PIPELINES setting # See: http://doc.scrapy.org

python3多執行緒爬蟲爬取某美女圖片網站的指定頁圖片資源，你懂的

Queue（佇列物件） queue是python3中的標準庫，可以直接import queue引用;佇列是執行緒間最常用的交換資料的形式。 python下多執行緒的思考對於資源，加鎖是個重要的環節。因為python原生的list,dict等，都是not

爬蟲小試--用python中requests和urllib模塊爬取圖片

源碼一個 -- .text 本地 requests style intel 加載今天突發奇想小試爬蟲,獲取一下某素材站一些圖片實現步驟如下: import re import requests from urllib import request import os

[python3.6]爬蟲實戰之爬取淘女郎圖片

原博主地址：http://cuiqingcai.com/1001.html 原博是python2.7寫的，並且隨著淘寶程式碼的改版，原博爬蟲已經不可用。參考 http://minstrel.top/TaoBaoMM 這位博主跟我一樣最近正在學習爬蟲。 1 定個小目標 l

python3爬蟲爬取圖片，爬取新聞網站文章並儲存到資料庫

2017年9月16日零基礎入門Python，第二天就給自己找了一個任務，做網站文章的爬蟲小專案，因為實戰是學程式碼的最快方式。所以從今天起開始寫Python實戰入門系列教程，也建議大家學Python時一定要多寫多練。目標 1，學習Python爬蟲 2

Python3 爬蟲（三） -- 爬取豆瓣首頁圖片

序前面已經完成了簡單網頁以及偽裝瀏覽器的學習。下面，實現對豆瓣首頁所有圖片爬取程式，把圖片儲存到本地一個路徑下。首先，豆瓣首頁部分圖片展示這只是擷取的一部分。下面給出，整個爬蟲程式。爬蟲程式

爬取圖片並存入資料夾中

import urllib.request import urllib.parse import redef handler_url(page,base_url): url = base_url + str(page) + '/' headers = {

python3.6爬蟲案例：爬取朝秀幫圖片

一、寫在前面之前寫的兩篇部落格：python3.6爬蟲案例：爬取百度歌單點選開啟連結；python3.6爬蟲案例：爬取頂點小說（愛看小說同學的福利）點選開啟連結第一個案例寫了如何在百度音樂歌單中欄中爬取其歌曲以及對應的歌手和歌曲所在的連結，並儲存在相應的資料夾

[實戰演練]python3使用requests模塊爬取頁面內容

取圖簡書服務器二進制 tty ret index 內容亂碼 20px 本文摘要： 1.安裝pip 2.安裝requests模塊 3.安裝beautifulsoup4 4.requests模塊淺析 + 發送請求 + 傳遞URL參數 + 響應內容

Python3實現QQ機器人自動爬取百度文庫的搜索結果並發送給好友（主要是爬蟲）

OS __main__ end aid 機器 https code __name__ gbk 一、效果如下：二、運行環境： win10系統；python3；PyCharm 三、QQ機器人用的是qqbot模塊用pip安裝命令是： pip

python 把已爬取圖片鏈接用urllib下載到本地

技術分享 pytho mage com python3 tle bubuko img title image:圖片鏈接 d:\\pic\%s.jpg:保存到本地的圖片路徑 title：自己定義的一個圖片名稱 python3用的是urllib.request.url

scrapy爬取圖片

深復制 cal xtra n) containe ... line example 定義一.遇到的問題總結 scrapy中爬取的多有數據（通過spider.py）,最後必須通過items實例格式化後，傳遞到pipelines中進行進一步的處理（註意scrapy內置的pip

python接口自動化測試十八：使用bs4框架爬取圖片

image import 解析器批量文件夾自動化測試接口 data- IT # 爬圖片# 目標網站：http://699pic.com/sousuo-218808-13-1.htmlimport requestsfrom bs4 import BeautifulSo

利用python爬蟲爬取圖片並且制作馬賽克拼圖

python爬蟲 splay ise 做事 c-c sea mage item -a 　　想在妹子生日送妹子一張用零食（或者食物類好看的圖片）拼成的馬賽克拼圖，因此探索了一番= =。　　首先需要一個軟件來制作馬賽克拼圖，這裏使用Foto-Mosaik-Edda（網上也有在

urllib2爬取圖片成功之後不能打開

open user hide 發送 gecko brush -a close 謝謝經過8個小時的摸索，終於決定寫下此隨筆！初學爬蟲，準備爬取百度美女吧的圖片，爬取圖片之後發現打不開，上代碼： import urllib import urllib2 from lx

python3中aiohttp+asyncio 高效率爬取圖片例子，本地儲存

相關推薦