1. 程式人生 > >如何用爬蟲爬去一張圖片

如何用爬蟲爬去一張圖片

這次是一隻簡單的爬蟲, 程式碼只有五行, 目的是爬去一張網頁上的圖片

先展示程式碼吧

import urllib.request

r = urllib.request.urlopen('http://image.samanlehua.com/mh/25933.jpg')
r = r.read()
with open('picture.jpg', 'wb') as f:
    f.write(r)
第一行: 匯入urllib.request模組
urllib意思是url library. 是一個它提供了一系列操作url的功能, 是一個常用的也比較基礎的基本庫.

request模組的文件介紹是這樣的: for opening and reading URLs

. 所以, 我們要開啟並讀取一個url的內容就可以用url.request, 因為我們只需要用urllib的這一個模組, 所以只匯入這個模組就好了.

第二行: 呼叫urlopen方法獲取url內容
第三行: 呼叫read()方法
因為我們找到的這個url是圖片檔案, 它是二進位制檔案, 所以不用進行轉碼. 也就是說不用呼叫decode方法.
第四, 五行: 檔案操作, 將圖片儲存
這兩行程式碼就是python的檔案操作了, 開啟一個picture.jpg檔案, 並且以wb的形式寫入我們從url上讀取的內容.

OK, 現在我們可以看到資料夾中出現了一個檔案picture.jpg了, 也就是我們url連結的圖片.

需要注意的是: 這個圖片url連結是預先要知道的(自己到網頁原始碼裡找). 所以說這個程式是非常雞肋的, 但對初學爬蟲者來說也算是個專案了.