解決python爬蟲問題：urllib.error.HTTPError: HTTP Error 301: The HTTP server returned a redirect error that would lead to an infinite loop.

阿新 • • 發佈：2021-11-19

報錯的原始方法：

1）使用request.Request，出現上述錯誤。html無法爬取

from urllib import request

def get_html(self, url):
    print(url)
    req = request.Request(url=url, headers={'User-Agent': random.choice(ua_list)})
    res = request.urlopen(req)
    # html = res.read().decode()
    html = req.read().decode("gbk", 'ignore 
')
    with open(filename, 'w') as f:
        f.write(html)
    self.parse_html(html)

解決方法：

1）將urllib.request 換成requests庫，需要重新安裝。

2）具體原因，我也不清楚。

　　import requests
    def get_html(self, url):
        print(url)
        req = requests.get(url=url, headers={'User-Agent': random.choice(ua_list)})
        req.encoding  
= 'utf-8'
        # print(req.text)
        # res = request.urlopen(req)
        # html = res.read().decode()
        # print(req)
        # html = req.read().decode("gbk", 'ignore')
        # print(html)
        # 直接呼叫解析函式
        # filename = '123456.html'
        # with open(filename, 'w') as f:
        # 
     f.write(html)
        self.parse_html(req.text)

解決python爬蟲問題：urllib.error.HTTPError: HTTP Error 301: The HTTP server returned a redirect error that would lead to an infinite loop.

報錯的原始方法： 1）使用request.Request，出現上述錯誤。html無法爬取 from urllib import request

Python 爬蟲：跳轉頁面時，網頁連結(url)不變，XHR中的含有網頁資訊的檔案連結(url)不變，解決辦法

轉載自：https://blog.csdn.net/weixin_44606217/article/details/98629593 解決辦法在文末問題：

Python爬蟲之urllib基礎用法教程

綜述本系列文件用於對Python爬蟲技術進行簡單的教程講解，鞏固自己技術知識的同時，萬一一不小心又正好對你有用那就更好了。

Python爬蟲：手把手教你寫迷你爬蟲架構

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

python 爬蟲 02-urllib+request

1. urllib.request模組 1.1 版本 python2 ：urllib2、urllib python3 ：把urllib和urllib2合併,urllib.request

python爬蟲：抓取下載電影檔案，合併ts檔案為完整視訊

目標網站：https://www.88ys.cc/vod-play-id-58547-src-1-num-1.html 反貪風暴4 對電影進行分析

python爬蟲：XPath語法和使用示例

python爬蟲：XPath語法和使用示例 XPath(XML Path Language)是一門在XML文件中查詢資訊的語言，可以用來在XML文件中對元素和屬性進行遍歷。

Python爬蟲：逆向分析酷我音樂請求引數

文章目錄前言 1. 請求分析 2. 獲取引數 3. 提取資訊結束語前言免責宣告：本篇博文的初衷是分享自己學習逆向分析時的個人感悟，所涉及的內容僅供學習、交流，請勿

Python爬蟲：編寫簡單爬蟲之新手入門

最近整理了一下python的基礎知識，大家一般對“爬蟲”這個詞，一聽就比較熟悉，都知道是爬一些網站上的資料，然後做一些操作整理，得到人們想要的資料，但是怎麼寫一個爬蟲程式程式碼呢？相信很多人是不會的

Python爬蟲：多種方式實現嗶哩嗶哩（bilibili）視訊下載

日常跳轉：匯入與簡介方法一分析與主要程式碼: 程式碼關於程式碼的一些註解：

python爬蟲：搜狗微信公眾號文章資訊的採集（https://weixin.sogou.com/），儲存csv檔案

1 import requests 2 from requests.exceptions import RequestException 3 from lxml import etree 4 import csv

Python爬蟲：使用Selenium爬取指定上市公司(如浦發銀行)的今年公告資訊

1 from selenium import webdriver#匯入庫 2 from selenium.webdriver.common.keys import Keys 3 from bs4 import BeautifulSoup

python爬蟲與資料視覺化——python爬蟲：補充SQLite

1.連線資料庫 2.建立資料表 3.插入資料 4.查詢資料

python爬蟲與資料視覺化——python爬蟲：儲存資料到SQLite

結果：

Python爬蟲：第一次初體驗

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

Python爬蟲：抓取智聯招聘崗位資訊和要求（基礎版）

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

Python爬蟲：抓取智聯招聘崗位資訊和要求（進階版）

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

Python爬蟲：爬取科技新聞，進而整理，產出資料分析

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

Python爬蟲：爬取喜馬拉雅音訊資料詳解

前言喜馬拉雅是專業的音訊分享平臺，彙集了有聲小說,有聲讀物,有聲書,FM電臺,兒童睡前故事,相聲小品,鬼故事等數億條音訊，我最喜歡聽民間故事和德雲社相聲集，你呢？

Python爬蟲：輸入公司名稱，爬取企查查網站中的公司資訊

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。