1. 程式人生 > >requests中 .text 和 .content區別

requests中 .text 和 .content區別

可能 utf byte imp col 使用 編碼 就會 -s

1 import requests
2 
3 url = https://www.baidu.com
4 response = requests.get(url)

1.response.content:  這個是直接從網絡上面抓取的數據,沒有經過任何解碼,所以是一個bytes類型,其實在硬盤上和在網絡上傳輸的字符串都是bytes類型

2.response.text:  這個是str的數據類型,是requests庫將response.content進行解碼的字符串,解碼需要指定一個編碼方式,requests會根據自己的猜測來判斷編碼的方式,所以有時候可能會猜測錯誤,就會導致解碼產生亂碼,這時候就應該使用‘response.content.decode(‘utf-8‘)‘進行手動解碼

requests中 .text 和 .content區別