python requests 詳細學習content 和text 的區別

阿新 • • 發佈：2019-02-13

之前使用requests 不求甚解，一直使用content輸出文字。閱讀文件後記錄如下：

import requests
r=requests.get('http://www.baidu.com')
print r.content
print r.text

你會發現，content輸出的文字沒問題，但是text輸出的文字貌似是亂碼。

深究下，我們使用

print type(r.content)
print type(r.text)

content 輸出型別為 str
text 輸出型別為 unicode

使用
print r.encoding

輸出 ISO-8859-1 編碼

屬於單位元組編碼，最多能表示的字元範圍是0-255，應用於英文系列。比如，字母’a’的編碼為0x61=97。

很明顯，iso8859-1編碼表示的字元範圍很窄，無法表示中文字元。

我們通過指定編碼

r.encoding='utf-8'
print r.text

此時，剛剛的亂碼已經可以正確顯示了。

至此，我們大致可以說

content返回的是str 型別，就是我們眼睛所看到的內容，被瀏覽器渲染過。
text返回的是unicode 型別，可能是返回的最原始的資料，可以理解為尚未渲染過。

不同看法歡迎大家留言討論

python requests 詳細學習content 和text 的區別

之前使用requests 不求甚解，一直使用content輸出文字。閱讀文件後記錄如下： import requests r=requests.get('http://www.baidu.com') print r.content print r.text

python request中的content和text的區別

一直不清楚requestes的content和text方法的區別，只知道content返回的是二進位制資料，而text返回的是文字資料先看看content的原始碼：註釋可知content返回的是bytes型也就是二進位制的資料在看看text的原始碼：意思是reques

requests庫中content和text呼叫的區別

詳情請檢視：https://www.jianshu.com/p/0e0336b370f3 對requests獲取的原始資料，有兩種獲取形式，一個是r.content一個是r.text。二者的區別在於content返回的是byte型資料，而text返回的是Unicode資料

python requests的content和text方法的區別

問題：一直在想requests的content和text屬性的區別，從print 結果來看是沒有任何區別的看下原始碼： @property def text

python requests庫學習筆記（下）

mail 接收緩存 nbsp 0.10 基本 eat agen 維基百科 1.請求異常處理請求異常類型：請求超時處理（timeout）：實現代碼： import requestsfrom requests import exceptions #引

java web基礎學習 Forward和Redirect區別

響應對象一次 servlet t對象資源 http 發的請求 Forward和Redirect代表了兩種請求轉發方式：直接轉發和間接轉發。對應到代碼裏，分別是RequestDispatcher類的forward()方法和HttpServletRequest類的sen

【python】第一日 python2和python3區別命名方式三種結構

一、python2和python3區別 1）print 語句區別　　python2：print是個class，所以可以不用加括號，print 1,2+3 　　python3：print是個內建函式，必須加括號，print（1，2+3，end=" "） 2）input區別　　python2：inp

python-常考：is 和 == 的區別

id:在記憶體中儲存的位置 type：變數的型別 value:變數的值 == :type,value is:type,value,id 結論： is 表示兩個變數的值是否在同一塊記憶體空間 == 表示的是值是否相等總結: is 返回的值是True ==返回的一定是true

python-requests資料驅動延伸 python-requests模組的講解和應用

在 python-requests模組的講解和應用基礎上進行資料驅動的延伸 task_01_requests.py #-*- coding:utf-8 -*- #task_01_requests.py # 1：利用requests模組，編寫一個可以完成http

python中 xpath中的//和/的區別

//表示文件裡的任何位置的節點/表示文件里根下的那些節點例如： //a//b/@abc 指的是文件中所有a元素的屬性為abc的後代b元素（包括子代元素）（多級）；//a/b/@abc 指的是文件中所有a元素的屬性為abc的子代b元素（一級）；/a/b/@abc 指的是根節點b元素的屬性為abc的子代b元素（

貝葉斯分類器(Python實現+詳細完整原始碼和原理)

在概率和統計學領域，貝葉斯理論基於對某一事件證據的認識來預測該事件的發生概率，由結果推測原因的概率大小首先，理解這個公式的前提是理解條件概率，因此先複習條件概率。 P(A|B)=P(AB)/P(B) 貝葉斯公式：在機器學習領域，貝葉斯分類器是基於貝葉斯

np.dot學習//range和xrange區別//

之前在最大熵的時候也遇到過，當時就沒搞清楚。 np.dot實現矩陣相乘，數學意義上的，矩陣1的某一行乘以矩陣2的某一列.還有一個函式matmul也能實現相似運算。而各個元素相乘，是a*b或者是np.multiply 矩陣相乘：dot，matmul 元素相乘：

pytest-22-fixture詳細介紹-error和failed區別

setup 聲明 star 代碼 pla 詳細詳細介紹 for ring fixture是pytest的核心功能，也是亮點功能，熟練掌握fixture的使用方法，pytest用起來才會得心應手！ fixture簡介 fixture的目的是提供一個固定基線，在該基線上測

Python requests模組params與data的區別

requests模組傳送請求有data、params兩種攜帶引數的方法。 params在get請求中使用，data在post請求中使用。 requests中文文件：點選開啟連結通過介紹，params是往url後面新增引數。

python文檔22-fixture詳細介紹-作為參數傳入,error和failed區別

3.6 獨立配置組件實現 win ssi html-1 int 前言 fixture是pytest的核心功能，也是亮點功能，熟練掌握fixture的使用方法，pytest用起來才會得心應手！ fixture簡介 fixture的目的是提供一個固定基線，在該基線上測試可

轉發：python中的網頁爬取函式requests.get（）和urlopen函式的區別

爬蟲裡面，我們不可避免的要用urllib中的urlopen()和requests.get()方法去請求或獲取一個網頁的內容,這裡面的區別在於urlopen開啟URL網址，url引數可以是一個字串url或者是一個Request物件，返回的是http.client.HTTPRespons

Python：bs4中 string 屬性和 text 屬性的區別及背後的原理

剛開始接觸 bs4 的時候，我也很迷茫，覺得 string 屬性和 text 屬性是一樣的，不明白為什麼要分成兩個屬性。 html = '<p>hello word</p>' soup = BeautifulSoup(html, 'lxml') p = soup.p print(p.

#Python第三方模組學習（一）——matplotlib之函式axes和subplot的區別

本篇系轉載文章，在原文中融入自己的見解使用pyplot直接畫圖和建立figure物件後，使用方法畫圖： 1.2Axes 和 Subplot 的概念上細微的區別 subplot（）方法很好理解，前兩個數字代表生成幾行幾列的子圖矩陣，最後一個數字代表選中的子圖

python入門學習-列表和元組（1）

索引個人 .so .cn pytho 入門 main 範圍 mage 數據結構是通過某種方式（例如對元素進行編號）組織在一起的數據元素的集合。這些數據元素可以是數字或者字符，甚至可以是其他數據結構。在python中，最基本的數據結構是序列（seque

python-requests-proxies判斷學習

ima pass php代碼 pytho 技術分享 div .text html echo 1 # coding:utf8 2 import requests 3 def prox(): 4 url = ‘http://115.159.33.177/ima

python requests 詳細學習content 和text 的區別

相關推薦