Day11 (黑客成長日記) 爬取網站圖片

阿新 • • 發佈：2018-11-03

#匯入第三方庫
# coding:utf-8
import requests,re

#找到需要爬取的網站'http://www.qqjia.com/sucai/sucai1210.htm'

#1>獲取網站  2>正則表示式匹配不同圖片的地址   3>找到所有圖片的URL
#開發講究見名識意

#1.1 定義一個函式get到url
def get_urls():
    #（1）獲取網站
    response = requests.get('http://www.qqjia.com/sucai/sucai1210.htm')
    # (2)通過正則匹配地址re庫,共有的內容儲存，不一樣的用  .*？
    url_add = r'<img border="0" alt="" src="(.*?)" /></p>'
    #（3）找到所有圖片的URL
    url_list = re.findall(url_add,response.text)
    # (4)列印驗證
    print(url_list)
    return url_list
#第四步，下載網頁資料
#再定義一個函式  目的：下載資料
def get_gif(url,name):
    #請求圖片地址  ，傳參
    response = requests.get(url)
    #下載圖片到目標位置--》D:\pygif
    with open('D:\pygif\%d.gif'%name,'wb') as ft :
        ft.write(response.content)

    # (5)啟動這個程式
if __name__ == '__main__':
    url_list = get_urls()
    a = 1
    for url in url_list:
        get_gif(url,a)
        a += 1

text是原始碼，content是二進位制資料

import requests,re
def url_get():
    response = requests.get('http://qq.yh31.com/zjbq/2920180.html')
    url_add = r'<img border="0" alt="" src="(.*?)" />'
    url_list = re.findall(url_add,response.text)
    print(url_list)
    return url_list
def download(url,name):
    response = requests.get(url)
    with open( 
'D:\pygif\%d'%name,'wb') as ft :
        ft.write(response.content)
if __name__ == '__main__':
    url_list = url_get()
    a = 1
    for url in url_list:
        com_url = 'http://mm.yh31.com:88'+ url
        download(com_url, a)
        a += 1

Day11 (黑客成長日記) 爬取網站圖片

#匯入第三方庫# coding:utf-8import requests,re#找到需要爬取的網站'http://www.qqjia.com/sucai/sucai1210.htm'#1>獲取網站 2>正則表示式匹配不同圖片的地址 3>找到所有圖片的URL#開發講究見名識意#1.1 定

網絡爬蟲（爬取網站圖片，自動保存本地）

accep RoCE itl mage pytho range @class == title 事先申明一點，這個人品沒有什麽問題，只是朋友發一段python源碼，再這裏分享大家。 1 import requests 2 from lxml import html

簡單爬蟲之爬取網站圖片

這裡選取的網址是 http://www.doutula.com 目的：爬取其中的圖片並且翻頁爬取首頁圖片的規則 <img src="https://ws3.sinaimg.cn/bmiddle/6af89bc8gw1f

Python3.6爬取網站圖片

最近幾天在學習python，寫了個簡單的爬蟲程式：成功執行程式碼的前提是安裝了Python需要的第三方庫，以下是程式碼： # -*- coding:utf8 -*- import os import re import requests as rq import urll

Python爬蟲(1)------爬取網站圖片

初學爬蟲的學習流程環境 python 3.6 使用 urlib庫進行爬取內容熟悉爬蟲首先對百度進行爬取 # -*- coding: utf-8 -*- import urllib.request url = 'http://www

使用ajax爬取網站圖片()

以下內容轉載自:https://www.makcyun.top/web_scraping_withpython4.html 文章關於網站使用Ajaxj技術載入頁面資料,進行爬取講的很詳細大致步驟如下: (1)爬取索引頁資料 (2)解析索引頁面資料 (3)爬取詳情頁資料 (4)解析詳情頁資料 (

並發爬取網站圖片

跳轉返回 aps {} map light 網站 div utf-8 某網站的圖片：通過“https://photo.fengniao.com/#p=4”（人像）進入某一主題。顯示的是幾十張縮略的小圖片以及相應的跳轉地址，點擊小圖片後獲取大圖片。想獲取小圖片背後的大

使用Python爬取網站圖片

最終程式碼：import requests import json import urllib def getSogouImag(category,length,path): n = length cate = category imgs = requests.get('http://pic.sogou.co

思路——根據網站鏈接爬取整個圖片網站

requests 方式效率 java實現 rap html 進行 os模塊 pat 八月入職新公司，發現公司的爬蟲系統主要用Java實現的偶爾用一些python，為此又看了下Java爬蟲，順便用之前同事推薦我的美女圖片網站練手（之前推薦時候python爬蟲勉強算經

批量爬取某圖片網站的圖片

批量爬取某圖片網站的圖片宣告：僅用於爬蟲學習，禁止用於商業用途謀取利益 1、網頁解析（1）開啟veer首頁，F12(谷歌瀏覽器)，輸入關鍵字，點選搜尋，點選檢視如圖畫圈位置（2）檢視search中的Headers，找到請求的URL和請求的paylo

福利向---Scrapy爬蟲爬取多級圖片網站

1.目標站分析目標站網址為https://52zfl.vip/zhaifuli/list_2_1.html 每頁網址有若干連結，點選每個連結，是每部圖片資源的詳情頁面，由於圖片數量較多，涉及到翻頁操作。通過分析頁面html程式碼，提取有用部分如下：

python爬取網站上的圖片並儲存到本地

　　1.匯入需要的模組requests，BeautifulSoup，os（用於檔案讀寫）。　　2.建立一個類，並初始化。 class BeautifulPicture: def __init__(self): # 類的初始化操作 self.headers = {

Python爬蟲爬取網站上的圖片

java網路程式設計____最簡單的爬蟲(爬取網站美女圖片)

package com.company.reptile; import java.io.BufferedReader; import java.io.DataInputStream; import java.io.File; import java.io.FileOutpu

[Python]如何簡單的爬取網站上的圖片。

為了熟練的運用協程，接下來的程式碼將用協程來實現。只是一個簡單的小demo。 import gevent import urllib.request import re from gevent import monkey monkey.patch_all() def

一個鹹魚的Python爬蟲之路（三）：爬取網頁圖片

you os.path odin 路徑生成存在 parent lose exist 學完Requests庫與Beautifulsoup庫我們今天來實戰一波，爬取網頁圖片。依照現在所學只能爬取圖片在html頁面的而不能爬取由JavaScript生成的圖。所以我找了這個網站

python爬蟲：爬取網站視頻

爬蟲 python python爬取百思不得姐網站視頻：http://www.budejie.com/video/新建一個py文件，代碼如下：#!/usr/bin/python # -*- coding: UTF-8 -*- import urllib,re,requests import sys

python爬取網頁圖片

ima com col list https pytho 表達式 images 5% 在Python中使用正則表達式，一個小小的爬蟲，抓取百科詞條網頁的jpg圖片。下面就是我的代碼，作為參考： #coding=utf-8 # __author__ = ‘Hinfa‘ im

Python3.5：爬取網站上電影數據

x64 沒有 () nbsp 運行 lpar target __init__ doc 首先我們導入幾個pyhton3的庫: from urllib import requestimport urllibfrom html.parser import HTMLParser 在

簡單的爬取網頁圖片

baidu alt idt ima 修改利用表達輸入 html import reimport urllib.request# ------ 獲取網頁源代碼的方法 ---def getHtml(url): page = urllib.request.urlope

Day11 (黑客成長日記) 爬取網站圖片

相關推薦