1. 程式人生 > >判斷字串編碼的方法

判斷字串編碼的方法

import chardet
f = open('file','r')
fencoding=chardet.detect(f.read())
print fencoding

fencoding輸出格式 {'confidence': 0.96630842899499614, 'encoding': 'GB2312'} ,只能判斷是否為某種編碼的概率。比較準確的結果了。輸入引數為str型別。

備註:

  • str利用decode方法根據str的編碼將其解碼為unicode字串型別
  • str利用encode根據特定的編碼將unicode字串型別轉換為特定的編碼