解決python3 requests中urlretrieve 403forbidden

阿新 • • 發佈：2019-02-04

在用requests庫中的urllib.request.urlretrieve(urlcode,folder_path+'test.jpg')去下載圖片的是否會報出403 forbidden的訪問禁止

res=requests.get(item)
    with open(folder_path+item[-10:],'wb') as f:
        f.write(res.content)

通過以上方法便可實現下載，其中item表示圖片的連結，folder_path表示本地路徑
以下為完成的用python3實現爬蟲圖片的程式碼

import  requests
from bs4 import  BeautifulSoup
import urllib.request

url='http://jandan.net/pic/page-7707' 

header = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'}

# header={'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36'}
source_code=requests.get(url,headers=header)

plain_text=source_code.text 


download_links=[]
Soup=BeautifulSoup(plain_text)
folder_path="/Users/chenmeiji/Desktop/a3/"
for pic_tag in Soup.find_all("img"):
    pic_link=pic_tag.get('src')
    download_links.append(pic_link)

for item in download_links:
    res=requests.get(item)
    with open(folder_path+item[-10:],'wb') as f:
        f.write 
(res.content)

實現以上爬蟲程式碼可參考我的另一篇部落格，零基礎實現爬蟲

解決python3 requests中urlretrieve 403forbidden

在用requests庫中的urllib.request.urlretrieve(urlcode,folder_path+'test.jpg')去下載圖片的是否會報出403 forbidden的訪問禁止 res=requests.get(item)

python3.7中mysqlclient安裝錯誤的解決辦法

http text 14. 如何選擇 status 圖片 visual ESS shadow 近期，安裝mysqlclient一直報錯，導出找資料，琢磨，大致解決如下：一、錯誤提示_mysql.c(29): fatal error C1083: 無法打開包括文件: “mys

python3.x中移除了cPickle模組；pycharm執行後出現no module named cv2解決方法；scikit-learn 0.18以及0.20版本中的cross_validati

1.python3.x中移除了cPickle模組，可以使用pickle模組代替。最終我們將會有一個透明高效的模組。 2、pycharm執行後出現no module named cv2解決方法在win 7 上成功安裝OpenCV之後，發現在PowerShell上能成功使用OpenC

python3 tkinter中iconbitmap讀點陣圖發生錯誤解決方法

from PIL import Image, ImageTk import tkinter as tk root = tk.Tk() im = Image.open("yourIcon.ico") img = ImageTk.PhotoImage(im) root.tk.call('wm',

關於崔慶才老師python3爬蟲中tesserocr安裝以及測試中出現Failed to init API, possibly an invalid tessdata path的完整解決方案

1 我假設大家都安裝了anaconda，因為我用的anaconda3，安裝目錄是 D:\ProgramData\Anaconda3； 2 安裝tesseract，地址是 https://digi.bib.uni-mannheim.de/tesseract/，我

python3 requests出錯重試解決方法

對python3下的requests使用並不是很熟練，今天稍微用了下，請求幾次下來後發現出現連線超時的異常，上網查了下，找到了一個還算中肯的解決方法。 retrying是python的一個自帶的重試包匯入方式： from retrying impor

解決python3中lxml最新版本沒有etree的問題

使用python3.6時安裝好lxml時按照許多網上的教程來引入會發現etree沒被引入進來解決辦法： import lxml.html etree = lxml.html.etree 這樣就可以使用etree了

python3.x中lambda表示式遇到的一些問題以及解決辦法

lambda表示式在python3中使用reduce，map會和2.x版本有很多區別想正常展示結果，需要一些一些動作。 map函式，不再返回陣列，需要轉換例如 map(lambda x: x ** 2, [1, 2, 3, 4, 5]) 將會顯示成： <ma

解決樹莓派中python3無法import模組RPi.GPIO的問題辦法

[email protected]:~ $ python3Python 3.6.4 (default, Apr 8 2018, 18:42:32) [GCC 6.3.0 20170516]

Python2.7中dict.values()+dict.values(),在Python3.5中解決辦法

首先來看下在Python2.7中程式碼： w={ 'a':1, 'b':2, 'c':3 } b={ 'aa':4, 'bb':5, 'cc':6 } r=w.values()+b.values() print(

一分鐘解決python3中的lxml庫中沒有etree模組的問題

在將以前寫過的python2.7版本的程式碼遷移到python3.6版本的環境中遇到了lxml中沒有etree模組的問題，經過查閱程式碼和資料發現使用pip安裝的lxml庫是最新版的，其中沒有整合etree模組，我看了自己之前使用的lxml版本是3.7.2於是使用 conda

解決node使用中8080端口被占用

查看 alt 結束進程 nbsp 重新分享 img logs 相同 1、首先按快捷鍵windows+R，在運行框裏輸入cmd，如圖所示，進入黑色界面後，輸入netstat -ano，查看端口。 2、找到8080端口，查看正在運行程序的pid，如圖所示。 3、回到桌面，

解決python3環境下twisted安裝問題

文件 bat 安裝問題 fin libs ble twisted 三方庫 ted twisted的安裝經常會出問題，提示： 1、twisted錯誤，報Unable to find vcvarsall.bat2、等解決辦法： 1.安裝wheel，命令：pip insta

linux下開發，解決cocos2d-x中編譯出現的一個小問題, undefined reference to symbol 'pthread_create@@GLIBC_2.2.5'

water span x86 code bject data- ace 技術分享 inux 解決cocos2d-x中編譯出現的一個小問題對於cocos2d-x 2.×中編譯中，若頭文件裏引入了#include "cocos-ext.h",在進行C++編譯的時候會遇到例

python3 requests 獲取拉勾工作數據

.post ict web data cit industry utf-8 wow64 first 1 #-*- coding:utf-8 -*- 2 __author__ = "carry" 3 4 import requests,json 5 6 fo

解決ASP.NET中ServiceStack.Redis每小時6000次訪問請求的問題

asp log style ack div net pre 小時使用 1.可以使用3.0的版本： Install-Package ServiceStack.Redis -Version 3.0 2.使用ServiceStack.Redis.Complete： Ins

python3.6中安裝numpy,pandas,scipy,scikit_learn,matplotlib等數據分析工具

scipy pandas python3.6中安裝numpy scikit_learn matplotlib等數據分析工具運行環境：python3.6+windows64位1.安裝pip（1）如果在安裝python3.6時，你有勾選關於pip的選項，那麽在python3,6中就會帶有pi

如何解決python3.5.2安裝scrapy的無法查找到vsvarall的問題

python scrapy vs140comntools vsvarall.bat windows twisted 最近在使用python的Scrapy爬蟲框架進行相應爬蟲項目的開發和學些。但是在Windows環境下安裝Scrapy的運行環境時，一直vsvarall.bat無法找到（i

解決安卓中單個dex方法數超過65535的方法

ati oid 超過 sta get ble text enabled 方法 1、百度下載 60K-methods.jar包，復制至libs文件夾中，添加到gradle中 2、在build.gradle中的defaultConfig{}下添加 multiDexEnable

tomcat配置虛擬路徑，可以解決實際開發中測試時前端訪問後臺電腦上的圖片的問題

ram 使用 mage height 顯示地址 cal 重啟 server 首先電腦上要已經安裝好tomcat,安裝tomcat的教程可以從網上找到很多。這裏就不贅述了。一般開始做一個web項目後，會涉及到用戶頭像，商品圖片等信息，這些圖片保存在項目中不方便，於是我將選

解決python3 requests中urlretrieve 403forbidden

相關推薦