1. 程式人生 > 其它 >網站編碼格式為 gzip ,爬取時 需要gzip解碼

網站編碼格式為 gzip ,爬取時 需要gzip解碼

技術標籤:20201208

在這裡插入圖片描述

#爬取網站html內容
import gzip
import requests
r = requests.get("url")

#gzip解碼
try:
    html=gzip.decompress(r.text).decode("utf-8")
except:
    html=r.text
print(html)