Python爬蟲爬取網站上的圖片

阿新 • • 發佈：2019-01-02

Python爬蟲爬取網站上的圖片

這裡以這個網站為例：http://www.nipic.com/topic/show_27168_1.html

右鍵滑鼠，檢視源

然後，看到網站的原始碼：

然後，發現了一些規律：圖片格式大都是.jpg ，alt 是圖片的描述。

2. 發現完這個規律那麼我們就可以開始寫程式碼啦（用正則表示式來表示這個規律然後把網頁是地址傳進去就ok啦）

import urllib.request

import re

import urllib


# 根據給定的網址來獲取網頁詳細資訊，得到的html就是網頁的原始碼

def getHtml(url):
    page = urllib.request.urlopen(url)

    html = page.read()

    return html.decode('UTF-8')


def getImg(html):
    reg = r'src="(.+?\.jpg)" alt'

    imgre = re.compile(reg)

    imglist = imgre.findall(html)  # 表示在整個網頁中過濾出所有圖片的地址，放在imglist中

    x = 0

    path = 'D:\DoyoGames\python_tu\\neg' #要儲存圖片得路徑 D:\DoyoGames\python_tu
                                            #要帶字尾 \\neg
    #path = 'D:\\neg'          #儲存圖片放在D盤了

    # 將圖片儲存到D:\\test資料夾中，如果沒有test資料夾則建立

    for imgurl in imglist:
        urllib.request.urlretrieve(imgurl, '{}{}.jpg'.format(path, x))  # 開啟imglist中儲存的圖片網址，並下載圖片儲存在本地，format格式化字串

        x = x + 1

    return imglist


#html = getHtml("http://www.ivsky.com/search.php?q=%E6%B5%B7&PageNo=9")  # 獲取該網址網頁詳細資訊，得到的html就是網頁的原始碼
#http://www.nipic.com/
html = getHtml("http://www.nipic.com/topic/show_27168_1.html")

print(getImg(html))  # 從網頁原始碼中分析並下載儲存圖片

print("爬蟲成功啦，快去看看資料夾得圖片")

執行結果：

儲存圖片的資料夾： D:\DoyoGames\python_tu （大家可以根據自己情況，修改一下

希望對你有幫助。

Python爬蟲爬取網站上的圖片

Python爬蟲——爬取網站的例項化原始碼

缺點：1爬了一個網站好幾次以後不能再進行爬取。沒有解決這個問題 2在寫入資料的時候還是存在很大問題。以後多加練習這個檔案的儲存的相關工作 import re import urllib.request def function(): """需求：1 https://re

使用python爬蟲——爬取淘寶圖片和知乎內容

本文主要內容：目標：使用python爬取淘寶圖片；使用python的一個開源框架pyspider（非常好用，一個國人寫的）爬取知乎上的每個問題，及這個問題下的所有評論最簡單的爬蟲——如下python程式碼爬取淘寶上模特圖片爬

java網路程式設計____最簡單的爬蟲(爬取網站美女圖片)

package com.company.reptile; import java.io.BufferedReader; import java.io.DataInputStream; import java.io.File; import java.io.FileOutpu

python爬蟲爬取百度圖片

爬蟲爬取百度圖片因公司業務需要，而且公司人手不足，我這個測試工程師需要臨時客串一下其他職位，所以，由我來爬取百度圖片。說明 1、最近稍微有點兒忙，沒顧得上整理。而且程式碼量比較少，所以註釋比較少。 2、如果需要直接使用我的程式碼，請將相應路徑檔名稱更改。具體

python爬蟲爬取好看的圖片

遇到好看的圖片你還在一張張用滑鼠點選儲存？作為一個IT從業者那就out了。。。必須高大上起來今天給大家介紹如何用爬蟲爬取好看的圖片，話不多說，開始。。。。。首先小夥伴們需要確保自己已經安裝了python和pip，並且已經配置好了環境變數，接下來需要安裝今天所用到的第

Python爬蟲爬取網站新聞

網站分析爬取過程獲取新聞連結地址使用requests包讀取新聞列表頁面，然後使用正則表示式提取出其中的新聞頁面連結，返回urls列表 def getList(url): li = requests.get(url) re

用python爬蟲爬取網頁桌布圖片（彼岸桌面網唯美圖片）

今天想給我的電腦裡面多加點桌布，但是嫌棄一個個儲存太慢，於是想著寫個爬蟲直接批量爬取，因為爬蟲只是很久之前學過一些，很多基礎語句都不記得了，於是直接在網上找了個有基礎操作語句的爬蟲程式碼，在這上面進行修改以適應我的要求和爬取的網頁需求注意：這次爬取的

python爬取網站上的圖片並儲存到本地

　　1.匯入需要的模組requests，BeautifulSoup，os（用於檔案讀寫）。　　2.建立一個類，並初始化。 class BeautifulPicture: def __init__(self): # 類的初始化操作 self.headers = {

[Python]如何簡單的爬取網站上的圖片。

為了熟練的運用協程，接下來的程式碼將用協程來實現。只是一個簡單的小demo。 import gevent import urllib.request import re from gevent import monkey monkey.patch_all() def

python 爬蟲爬取證券之星網站

爬蟲周末無聊，找點樂子。。。#coding:utf-8 import requests from bs4 import BeautifulSoup import random import time #抓取所需內容 user_agent = ["Mozilla/5.0 (Windows NT 10.0

利用python爬蟲爬取圖片並且制作馬賽克拼圖

python爬蟲 splay ise 做事 c-c sea mage item -a 　　想在妹子生日送妹子一張用零食（或者食物類好看的圖片）拼成的馬賽克拼圖，因此探索了一番= =。　　首先需要一個軟件來制作馬賽克拼圖，這裏使用Foto-Mosaik-Edda（網上也有在

python爬蟲爬取各大平臺女主播圖片

目標: 各大直播平臺~~~(虎牙,熊貓,鬥魚,全民),內的女主播直播封面圖片. 所需掌握知識: re正則表示式的,os模組,urllib模組剛剛將這幾個平臺的顏值區域女主播都爬了一遍,整體來說步驟大致相同,我們這裡就拿”虎牙直播”來做個示範,看懂之後,可以先去嘗試爬取”

Python爬蟲爬取網上圖片原始碼，可用來製作深度學習資料集

這次利用python設計一個爬取百度圖片上的圖片的原始碼，其中利用的是python的urllib，如果沒有裝的，可以使用Anconda在環境裡進行安裝或者 pip install urllib 這兩種方式都可以安裝，長話短說，上圖吧，點選執行後，輸入你要下載的圖片型別：比如，熊貓？美女？

Python爬蟲爬取美劇網站

一直有愛看美劇的習慣，一方面鍛鍊一下英語聽力，一方面打發一下時間。之前是能在視訊網站上面線上看的，可是自從廣電總局的限制令之後，進口的美劇英劇等貌似就不在像以前一樣同步更新了。但是，作為一個宅diao的我又怎甘心沒劇追呢，所以網上隨便查了一下就找到一個能用迅雷下載的美劇

python爬蟲爬取拉勾網站內容

本次主要內容是分享下拉勾網站模擬搜尋以及搜尋內容的爬取，這裡先引入一些用到的庫，由於網站本身的反爬蟲技術和網路原因，這裡使用了fake_useragent和多執行緒模式，當然如果有條件的話也可以使用代理池，這樣可以更加保險一點。由於我沒有弄那些收費的代理，而免費

python爬蟲-爬取美女圖片

當你發現某個網站上有大量的美女圖片，又非常想看，怎麼辦，網頁上看？每次看的時候都得載入吧！No，你可以把這些圖片都儲存到本地，然後，在你想看的時候就可以隨時看了，哈哈！多的不說。下面就來上程式碼： 1,匯入庫檔案: # -*- coding:utf-8 -*- # 通過request

python 爬蟲爬取某網站的漫畫

文章目錄宣告前言思路流程程式結果宣告為了表示對網站的尊重，已將網站地址隱藏，下載的漫畫之前我就看過了，所以也會刪掉，絕不侵犯網站的利益。前言

實戰python 爬蟲爬取百度貼吧圖片

#!/usr/bin/python import urllib,urllib2import re def getHtml(url): page = urllib2.urlopen(url) return page.read() def getImage(html): re_img = re.compil

python3多執行緒爬蟲爬取某美女圖片網站的指定頁圖片資源，你懂的

Queue（佇列物件） queue是python3中的標準庫，可以直接import queue引用;佇列是執行緒間最常用的交換資料的形式。 python下多執行緒的思考對於資源，加鎖是個重要的環節。因為python原生的list,dict等，都是not

Python爬蟲 爬取網站上的圖片

Python爬蟲 爬取網站上的圖片

相關推薦

Python爬蟲爬取網站上的圖片

Python爬蟲爬取網站上的圖片