python3-按關鍵字爬取百度圖片

阿新 • • 發佈：2019-02-03

別說話！上程式碼：

import re,os
import requests
from urllib.request import urlretrieve


def download(url,filename,filepath):
    path = os.path.join(filepath,filename)
    try:
        urlretrieve(url,path)
    except:
        print('【錯誤】當前圖片無法下載')


def search(word="美女",localpath="data/", page=None):
    localpath += word
    os.makedirs(localpath ,  
exist_ok=True)
    url = 'http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word={word}&pn={pn}&gsm={gsm:x}&ct=&ic=0&lm=-1&width=0&height=0'.format(word=word, pn=20 * page, gsm=40 + 20 * page)

    print("HHHC:0====>page=%d,url=\"%s\"" % (page,url))
    try:
        html = requests.get(url).text
    except 
:
        print("【錯誤】requests.get 失敗")
        return False
pic_url = re.findall('"objURL":"(.*?)",', html, re.S)
    i = 0;
    for url in pic_url:
        print(url)
        i = i + 1;
        filename = os.path.split(url)[1].split('?')[0]
        if len(filename.split(".")) != 2:
            print("【錯誤】檔名異常:"  
+ filename)
        download(url, filename, localpath)
    return
def search_20_page(word):
    for i in range(1, 30):
        search(word, "data/", i)


def test_search_list():
    obj_list = ["蘋果", "香蕉", "桔子", "橙子", "桃子", "櫻桃", "龍眼", "荔枝", "雪梨", "草莓", "葡萄", "獼猴桃", "菠蘿", "番石榴", "青梅"]
    for obj in obj_list:
        search_20_page(obj)


if __name__ =='__main__':
    test_search_list()

效果：

python3-按關鍵字爬取百度圖片

別說話！上程式碼：import re,os import requests from urllib.request import urlretrieve def download(url,filename,filepath): path = os.path.joi

python3 anaconda pycharm 爬取百度圖片

#-*- coding:utf-8 -*- import time import requests from urllib import request from xml import etree import random import os class baiduimgspider(obj

python3 anaconda pycharm 爬取百度圖片

#-*- coding:utf-8 -*- import time import requests from urllib import request from xml import etree import random import os class baiduimg

Python3爬蟲之爬取百度高清圖片

#!/usr/bin/env python # -*- coding:utf-8 -*- # Author: OFZFZS # Datetime:2018/3/23 11:00 # Description: 百度圖片爬取這裡只做了簡單處理,注意百度圖片返回的資料是aja

python爬取百度圖片代碼

python爬蟲；import json import itertools import urllib import requests import os import re import sys word=input("請輸入關鍵字：") path="./ok" if

selenium+chrome瀏覽器驅動-爬取百度圖片

com max-age col presence and 下載其他 htm row 百度圖片網頁中中，當頁面滾動到底部，頁面會加載新的內容。我們通過selenium和谷歌瀏覽器驅動，執行js，是瀏覽器不斷加載頁面，通過抓取頁面的圖片路徑來下載圖片。 1 from s

Python 3.5_簡單上手、爬取百度圖片的高清原圖 Python 3.5_簡單上手、爬取百度圖片的高清原圖

Python 3.5_簡單上手、爬取百度圖片的高清原圖 2017年11月10日 15:49:50 閱讀數：1008 利用工作之餘的時間，學習Python差不多也有小一個月的時間了，路漫漫其修遠兮，我依然是隻菜鳥。感覺

Python 爬取百度圖片的高清原圖

# coding=utf-8 """ 爬取百度圖片的高清原圖 Author : MirrorMan Created : 2017-11-10 """ import re import urllib import os import requests de

python爬取百度圖片---釋出exe小計編碼是個大坑

#*--coding:utf-8--* import requests import sitecustomize import os import sys reload(sys) sys.setdefaultencoding('utf-8') type=sys.getfilesystemencodi

Python3爬蟲-selenium爬取百度文庫

這是筆者爬取的第一個動態載入的網頁，使用的IDE是Pycharm，選擇的是百度文庫的一篇16年六級卷子的文件。若直接使用requests模組去得到網頁原始碼，會發現所得非所見，不能獲取到文件中的內容。看了網上數篇博文的思路，最後還是嘗試了使用selenium

python爬蟲爬取百度圖片

爬蟲爬取百度圖片因公司業務需要，而且公司人手不足，我這個測試工程師需要臨時客串一下其他職位，所以，由我來爬取百度圖片。說明 1、最近稍微有點兒忙，沒顧得上整理。而且程式碼量比較少，所以註釋比較少。 2、如果需要直接使用我的程式碼，請將相應路徑檔名稱更改。具體

Python 3.5_簡單上手、爬取百度圖片的高清原圖

利用工作之餘的時間，學習Python差不多也有小一個月的時間了，路漫漫其修遠兮，我依然是隻菜鳥。感覺學習新技術確實是一個痛並快樂著的過程，在此分享些心得和收穫，並貼一個爬取百度圖片原圖的程式碼。一、安裝，搭建環境首先是Python的安裝，我想網上已經很多了，如果

scrapy爬取百度圖片

百度圖片基本沒什麼反爬蟲措施，我們爬取圖片時直接滑鼠右鍵--->檢查----->network---->XHR，往下拖動得到頁面，可以看到headers下的General,檢視實際的請求Request URL,提取其中的關鍵資訊即可話不多說，直接上程式碼

Python依據單個關鍵詞爬取百度圖片

最近由於工作需要要使用大量的水果蔬菜圖片，故萌生使用爬蟲抓取百度圖片的想法，並未用於商業用途，只是為了測試資料。所以並未使用多執行緒、框架等技術。由於百度圖片是動態載入的，發現搜尋關鍵詞後action的引數很相似，故使用requests.get(url ,

java爬取百度圖片

package com.kendy.spider; import java.io.File; import java.io.FileOutputStream; import java.io.InputStream; import java.net.HttpURLConnection; import java

python 3 爬取百度圖片

糾結於爬取百度圖片，竟然花費了一天的時間才讓程式順利跑起來。其中踩坑無數。而且還發現公司電腦實在是比較差勁。。。 import requests import urllib import os , re from os.path import join

Python 爬取百度圖片

百度圖片抓包資料: 引數詳情: 資料解析: from urllib import request, parse from http import cookiejar import

python爬取百度搜索圖片

知乎需要 with 異常 mage 不足 request height adr 在之前通過爬取貼吧圖片有了一點經驗，先根據之前經驗再次爬取百度搜索界面圖片廢話不說，先上代碼 #!/usr/bin/env python # -*- coding: utf-8 -*- #

Python簡易爬蟲爬取百度貼吧圖片

decode works 接口 def 讀取 min baidu 得到 internal 　　　　　通過python 來實現這樣一個簡單的爬蟲功能，把我們想要的圖片爬取到本地。(Python版本為3.6.0) 一.獲取整個頁面數據　　 def getHtml(url)

Python爬蟲實例（一）爬取百度貼吧帖子中的圖片

選擇圖片查看負責 targe mpat wid agent html headers 程序功能說明：爬取百度貼吧帖子中的圖片，用戶輸入貼吧名稱和要爬取的起始和終止頁數即可進行爬取。思路分析：一、指定貼吧url的獲取例如我們進入秦時明月吧，提取並分析其有效url如下

python3-按關鍵字爬取百度圖片

相關推薦