Python3 編碼問題：怎麼將Unicode轉中文，以及GBK亂碼ÖÐ¹úÉÙÊýÃñ×åÌØÉ«´åÕ¯

阿新 • • 發佈：2019-01-20

原理：

如果***type(text) is bytes***，
那麼text.decode('unicode_escape')

*decode對應bytes*
如果type(text) is str，
那麼text.encode(‘latin1’).decode(‘unicode_escape’)
*encode對應str*

1. 案例：

#coding=utf-8
import requests,re,json,traceback
from  bs4 import  BeautifulSoup

def qiushibaike():
    content = requests.get('http://baike.baidu.com/city/api/citylemmalist?type=0&cityId=360&offset=1&limit=60' 
).content

    soup = BeautifulSoup(content, 'html.parser')
    print(soup.prettify())  #.decode("unicode_escape")
    #目前soup.prettify()為str
    new=soup.prettify().encode('latin-1').decode('unicode_escape')
    #.dencode('latin-1').encode('latin-1').decode('unicode_escape')

    print(new)


if __name__=='__main__' 
:
    qiushibaike()

2. 結果對比：

這裡寫圖片描述

案例2，\xe5\x8f\xa4\xe8\xbf\xb9編碼

\xe5\x8f\xa4\xe8\xbf\xb9編碼處理

userInputTag=["\xe5\x8f\xa4\xe8\xbf\xb9","\xe5\xbb\xba\xe7\xad\x91"]
print(userInputTag[0].encode('latin-1').decode('utf-8'))

結果：

古蹟

完成轉化

出現GBK無法編譯

另外爬取時，網站程式碼出現GBK無法編譯python3,如出現如下：

<h1 
>ÖÐ¹úÉÙÊýÃñ×åÌØÉ«´åÕ¯[6]</h1>

示例：

#coding=utf-8
import requests
#共有6頁,首頁為空不為6
for i in range(6):
    if i==0:
        url='http://www.tcmap.com.cn/list/zhongguoshaoshuminzutesecunzhai.html'

    else:
        url='http://www.tcmap.com.cn/list/zhongguoshaoshuminzutesecunzhai'+str(i)+'.html'
    response=requests.get(url)
    print(type(response))
   #如需成功編譯，在.TEXT下面增加#號部分 
    html=response.text   #.encode('latin-1').decode('GBK')
    print(html)

這裡寫圖片描述

檔案讀寫操作codecs.open

python 檔案讀寫時用open還是codecs.open
案例：當我們需要寫入到TXT中的過程中
代替這繁瑣的操作就是codecs.open，例如

import codecs
fw = codecs.open(‘test1.txt’,’a’,’utf-8’)
fw.write(line2)

不會報錯，說明寫入成功。這種方法可以指定一個編碼開啟檔案，使用這個方法開啟的檔案讀取返回的將是unicode。寫入時，如果引數是unicode，則使用open()時指定的編碼進行編碼後寫入；如果是str，則先根據原始碼檔案宣告的字元編碼，解碼成unicode後再進行前述操作。相對內建的open()來說，這個方法比較不容易在編碼上出現問題。

Python3 編碼問題：怎麼將Unicode轉中文，以及GBK亂碼ÖÐ¹úÉÙÊýÃñ×åÌØÉ«´åÕ¯

原理：

1. 案例：

2. 結果對比：

案例2，\xe5\x8f\xa4\xe8\xbf\xb9編碼

出現GBK無法編譯

檔案讀寫操作codecs.open

Python3 編碼問題：怎麼將Unicode轉中文，以及GBK亂碼ÖÐ¹úÉÙÊýÃñ×åÌØÉ«´åÕ¯

python3 把\u開頭的unicode轉中文，把str形態的unicode轉中文

PHP Unicode編碼與解碼_Unicode轉中文_中文轉Unicode字元

C++ Builder 源碼：TTS 文字轉語音，可以朗讀文字，或者把文字轉為 wav 聲音文件

Delphi中Unicode轉中文

插入排序：將一部分看成有序，一部分無序，無序的第一個數字與前面的交換，需要臨時變數temp來儲存無序的第一個

用PHP將Unicode 轉化為UTF-8

java 中文轉Unicode 以及 Unicode轉中文

前端之路：網頁內容轉圖片，並且複製網頁內容，並且優化體驗。（截圖外掛Clipboard.js 的使用）。

如何在vscode裡將px轉rem，而且還得爽！

jmeter中文亂碼及Unicode轉中文

canvas畫布儲存圖片，avaScript將圖片轉畫布，用JavaScript將畫布保持成圖片格式，上傳阿里雲

avaScript將圖片轉畫布，用JavaScript將畫布保持成圖片格式

學會將PDF轉Excel，一鍵實現轉換

命名更改小結：下劃線轉駝峰，或駝峰轉下劃線

sqlite3 unicode轉中文

41歲阿里工程師：35歲轉管理，真的是必經之路嗎？

codewars解題筆記 —— 將字串轉駝峰，單詞首字母大寫

python3.6：學會兩行程式碼，深刻理解列表

解決URLencode編碼時將空格轉成+的問題

Python3 編碼問題： 怎麼將Unicode轉中文，以及GBK亂碼ÖÐ¹úÉÙÊýÃñ×åÌØÉ«´åÕ¯

原理：

1. 案例：

2. 結果對比：

案例2，\xe5\x8f\xa4\xe8\xbf\xb9編碼

出現GBK無法編譯

檔案讀寫操作codecs.open

相關推薦

Python3 編碼問題：怎麼將Unicode轉中文，以及GBK亂碼ÖÐ¹úÉÙÊýÃñ×åÌØÉ«´åÕ¯