小白的Python之路 day1 Python3的bytes/str之別

阿新 • • 發佈：2017-12-18

分片 esc 怎樣抽象技術搜索參數之路 ring

原文：The bytes/str dichotomy in Python 3 Python 3最重要的新特性大概要算是對文本和二進制數據作了更為清晰的區分。文本總是Unicode，由str類型表示，二進制數據則由bytes類型表示。Python 3不會以任意隱式的方式混用str和bytes，正是這使得兩者的區分特別清晰。你不能拼接字符串和字節包，也無法在字節包裏搜索字符串（反之亦然），也不能將字符串傳入參數為字節包的函數（反之亦然）。這是件好事。不管怎樣，字符串和字節包之間的界線是必然的，下面的圖解非常重要，務請牢記於心：技術分享圖片

enter image description here 字符串可以編碼成字節包，而字節包可以解碼成字符串。 >>>‘€20‘.encode(‘utf-8‘) b‘\xe2\x82\xac20‘>>> b‘\xe2\x82\xac20‘.decode(‘utf-8‘)‘€20‘ 這個問題要這麽來看：字符串是文本的抽象表示。字符串由字符組成，字符則是與任何特定二進制表示無關的抽象實體。在操作字符串時，我們生活在幸福的無知之中。我們可以對字符串進行分割和分片，可以拼接和搜索字符串。我們並不關心它們內部是怎麽表示的，字符串裏的每個字符要用幾個字節保存。只有在將字符串編碼成字節包（例如，為了在信道上發送它們）或從字節包解碼字符串（反向操作）時，我們才會開始關註這點。傳入encode和decode的參數是編碼（或codec）。編碼是一種用二進制數據表示抽象字符的方式。目前有很多種編碼。上面給出的UTF-8是其中一種，下面是另一種： >>>‘€20‘.encode(‘iso-8859-15‘) b‘\xa420‘ >>> b‘\xa420‘.decode(‘iso-8859-15‘) ‘€20‘ 編碼是這個轉換過程中至關重要的一部分。離了編碼，bytes對象b‘\xa420‘只是一堆比特位而已。編碼賦予其含義。采用不同的編碼，這堆比特位的含義就會大不同： >>> b‘\xa420‘.decode(‘windows-1255‘) ‘?20‘ 據說百分之八十的金錢損失皆因使用錯誤的編碼導致，因此務必小心謹慎。轉載地址：https://www.cnblogs.com/txw1958/archive/2012/07/19/2598885.html

小白的Python之路 day1 Python3的bytes/str之別

分片 esc 怎樣抽象技術搜索參數之路 ring 原文：The bytes/str dichotomy in Python 3 Python 3最重要的新特性大概要算是對文本和二進制數據作了更為清晰的區分。文本總是Unicode，由str類型表示，二進制數據則由b

小白的Python之路 day1 Python3的bytes/str之別

小白的Python之路 day1 Python3的bytes/str之別

小白python爬蟲之路——初識爬蟲原理

小白python爬蟲之路——對字符串的處理

python之路--day1--輸入與輸出&&數據類型

python學習之路-Day1

python攻克之路day1

Python全棧之路Day1(補)

Python學習之路Day1：passwd

python學習之路Day1：模塊初識

Python之路,Day1 - Python基礎1

python的學習之路day1

python之路-Day1 自記筆記

小白機器學習基礎演算法學習必經之路（上）

小白機器學習基礎演算法學習必經之路（下）

小白的OpenGL3.3自學之路(2)OpenGL3.3之開啟一個視窗

python成長之路-----day1-----作業（登入程式和三級選單） python成長之路-----day1-----作業（登入程式和三級選單）

python學習之路-字串（str）和列表（list）的互相轉換

Git小白到老鳥的進階之路

我的html自學之路--day1

小白的正則表達式學習之旅-02

小白的Python之路 day1 Python3的bytes/str之別

相關推薦