1. 程式人生 > >零基礎Python爬蟲下載圖片 10分鐘搞定

零基礎Python爬蟲下載圖片 10分鐘搞定

本人從未學過Python  想開始學但是 但是不喜歡聽理論課 就直接開始在時間中學習

進入正題

Python爬蟲非常簡單 

第一步

首先獲取開啟頁面 獲取整個網頁原始碼

def getHtml(url):
    page = urllib.request.urlopen(url)  ##開啟頁面
html = page.read() ##獲取目標頁面的原始碼
return html

html就是真個網頁原始碼

第二步

正則表示式匹配

正則表示式想學懂個人認為挺費時間的 網上又正則表示式匹配器  會用就OK

html = getHtml("http://www.quanjing.com/category/118291.html"
) reg = "http://.+?\\.jpg" img = re.compile(reg) html = html.decode('utf-8')
imglist = re.findall(img, html)

imglist是匹配圖片url的陣列

最後下載 Python2用 

urllib.urlretrieve(imglist[0], 'D:/1.jpg')

Python3 用

urllib.request.urlretrieve(imglist[0], 'D:/1.jpg')
最後附上原始碼
#coding =utf-8
import urllib.request
import re
def getHtml(url):
    page = urllib.request.urlopen(url)  ##開啟頁面
html = page.read() ##獲取目標頁面的原始碼 return html if __name__=="__main__": html = getHtml("http://www.quanjing.com/category/118291.html") reg = "http://.+?\\.jpg" img = re.compile(reg) html = html.decode('utf-8') imglist = re.findall(img, html) print(imglist[0]) urllib.request.urlretrieve(imglist[0
], 'D:/1.jpg')

然後到你的D盤去找圖片吧 名字1.jpg




相關推薦

基礎Python爬蟲下載圖片 10分鐘

本人從未學過Python  想開始學但是 但是不喜歡聽理論課 就直接開始在時間中學習進入正題Python爬蟲非常簡單 第一步首先獲取開啟頁面 獲取整個網頁原始碼def getHtml(url): page = urllib.request.urlopen(url)

Python:10分鐘不寫代碼的爬蟲

出現 ring swe 導入 gem 取數據 bbb del delay 代碼自己敲 使用 Chrome 瀏覽器插件 Web Scraper 可以輕松實現網頁數據的爬取,不寫代碼,鼠標操作,點哪爬哪,還不用考慮爬蟲中的登陸、驗證碼、異步加載等復雜問題。 Web Scrap

基礎Python爬蟲實戰:豆瓣電影TOP250

我們曾經抓取過貓眼電影TOP100,並進行了簡單的分析。但是眾所周知,豆瓣的使用者比較小眾、比較獨特,那麼豆瓣的TOP250又會是哪些電影呢? 我在整理程式碼的時候突然發現一年多以前的爬蟲程式碼竟然還能使用……那今天就用它來演示下,如何通過urllib+BeautifulSoup來快

Python資料處理之(十 八)10分鐘matplotlib

Matplotlib 簡介 1.1 為什麼用 Matplotlib 1.2 Matplotlib 安裝 基本使用 2.1 基本用法 2.2 figure 影象 2.3 設定座標軸1 2.4 設定座標軸2 2.5 Legend 圖例 2.6 Annota

10分鐘Lync 2010和Quintum AF集成

Lync Quintum AF集成 接線拓撲接線方法:l 電信直線直接接在Quintum AF的FXO口上l AF采用RJ45接入網絡 使用效果:l PSTN用戶撥打直線的號碼,會聽到二次撥號音,然後再輸入Lync用戶的分機號碼就可以直接振鈴Lync用戶l Lync用戶直接撥打外部號碼就可以直

程式設計師界改BUG“神”發明,學會10分鐘一個BUG

對於大部分開發人員來說,你所看到的絕大部分BUG已經被別人修復並且分享出來了,這時候百度已經足以幫你 但是你也有可能會遇到一些稀奇古怪的Bug,這時候你就需要靜下心來,好好的仔細研究一下了。下面,分享一下我偶然得到的心得體會。 首先,找出Bug 換環境 換使用者

少兒基礎程式設計 設計製作遊戲 動畫全視訊教程

課程簡介: Scratch是一款由麻省理工學院(MIT) 設計開發的少兒程式設計工具,有趣的介面,積木式的程式指令,不僅能激發孩子們的興趣,易於孩子們使用,更能寓教於樂,讓孩子們獲得創作中的樂趣。是近十年全世界最流行的兒童程式語言! 課程目錄: 01.程式設計

nginx安裝詳細版【10分鐘

話不都說,如果不是太瞭解nginx的話 給大家推薦一篇之前寫的部落格,請點選nginx全部知識 百度雲分享連線: 連結:https://pan.baidu.com/s/1fLBUSSLNHMCOcCIOcY6kwg 提取碼:mavd 注: 裡邊有安裝包和文件都有,特別詳細,不下載

玩轉雲主機,手把手叫你10分鐘一個屬於自己wordpress部落格(mysql詳盡篇)

前言 寫到這裡,在前面幾篇我們已經安裝好了所需的環境,我還用七牛雲主機,在搭建了SS,以後就可以愉快的訪問谷歌了(你懂的)。 當然,其實主機沒有展現它原本的猙獰。我們還可以用它來做點什麼呢? 當然是搭建個屬於自己的部落格!!! 一、前置環境 php nginx

10分鐘Java帶token驗證的註冊登入

這是spring boot框架下的登入註冊功能,並且帶有token驗證,可以用於生產環境的例項原理太簡單,直接上程式碼,讓你知道什麼叫拿來主義!!1,java中專案介紹 2,resources 中的內容3,用法:建立好所有的需要的類,,資料庫中建立好需要的資料庫,程式碼複製貼上,啟動,就可以用了實際程式碼:&

TCP/IP協議是什麼?我們10分鐘

零·程式設計的我們為什麼要了解TCP/IP? 我們來想想,我們編寫的程式大致可以分為幾種?為了我們的生活方便,我們運用程式設計將我們的工作效率大大提高,這是一種工具性的程式。好了,可是我們的程式不是拿來自己用用就可以了,我想每一個具有網際網路和程式設計思想的人

【前端知識體系-JS相關】10分鐘JavaScript正則表示式高頻考點

1.正則表示式基礎 1.1 建立正則表示式 1.1.1 使用一個正則表示式字面量 const regex = /^[a-zA-Z]+[0-9]*\W?_$/gi; 1.1.2 呼叫RegExp物件的建構函式 const regex = new RegExp(pattern, [, flags]) 1.1.3

HTML5 知識一覽,10分鐘

#HTML5知識點彙總 ##HTML5 中的一些有趣的新特性 用於繪畫的 canvas 元素 用於媒介回放的 video 和 audio 元素 對本地離線儲存的更好的支援 新的特殊內容元素,比如 article、footer、header、nav、section 新的表單控制元件,比如 calendar(日曆

10分鐘 Java 併發佇列好嗎?好的

| **好看請贊,養成習慣** > - 你有一個思想,我有一個思想,我們交換後,一個人就有兩個思想 > > - If you can NOT explain it simply, you do NOT understand it well enough 現陸續將Demo程式碼和技術文

10分鐘讓你困惑的 Jenkins 環境變數

## 前言 Jenkins, DevOps 技術棧的核心之一,CI/CD 離不開編寫 Pipeline 指令碼,上手 Jenkins ,簡單查一下文件,你就應該不會被 agent,stages,step 這類關鍵詞弄懵,也能很快構建出 pipeline 的骨架 但是當向骨架中填充內容的時候,尤其如何利

python基礎爬蟲--編寫第一個網絡爬蟲

等待 客戶端瀏覽器 身份驗證 1.2 不存在 ssp 地址 執行c ade 首先要說明的是,一下代碼是在python2.7版本下檢測的 一.最簡單的爬蟲程序 --下載網頁 import urllib2 request=urllib2.Request("http://www.

python爬蟲下載20張圖片到本地

資料全都是寫死的,有需要可以自行修改。 import requests from lxml import etree base_url = "https://unsplash.com/search/photos/flower" headers = {"User-Agent":

Python爬蟲 -下載百度貼吧圖片

先放上程式的程式碼 import urllib.request import os import easygui as g import re def url_open(url): req = urllib.request.Request(url)

python爬蟲獲取圖片基礎教程

結合前述第一個部落格,簡單的一個爬取圖片的程式碼 環境: anaconda+python 3.6.1 import requests from lxml import etree def get_url(): url='http://image.so.com/

這是一個轉載,關於python下載 圖片視頻

python 爬蟲 python2 python3 urllib 資源 下載目的:再熟悉下python強大的數據處理能力和python2,3的區別情景:貼吧上的圖片,數據結構龐大的xml,某些國外比較火熱的資源分享平臺,你喜歡的漫畫,想看的電影,只要資源不錯,python‘都可以幫你實現查找,連接下載。原理: