1. 程式人生 > >Python3 chardet模組檢視編碼格式

Python3 chardet模組檢視編碼格式

chardet模組可以檢視如下的編碼格式

這裡寫圖片描述
需要注意的是,如果遇到GBK2312等編碼的,在decode和encode時,一律使用GBK進行編碼或者解碼,這是因為GBK是其他GBK編碼的超集,向下相容所有的GBK編碼。

下面是一個例子:

#coding=utf-8
import urllib.request
import chardet
url = 'http://www.baidu.com'

a = urllib.request.urlopen(url)

'''
chardet模組
使用該模組可以檢視字串的編碼格式:chardet.detect()
'''
encode = chardet.detect(a.read())
print(encode['encoding'
]) #假設存在一個a.txt的檔案 f = open('a.txt', 'rb') print(chardet.detect(f.read(100)))