黃聰:pycharm開發python 在python Console中輸出的程式有亂碼,含有中文的輸出
阿新 • • 發佈:2019-02-18
- 檔案編碼是UTF-8,同時在檔案頭新增 # -*- coding: utf-8 -*-
- 檔案中所有的字串前都加u,如 u"中文"
- 在輸入(抓取某些utf-8/gbk的網頁)、輸出(輸出到網頁、終端)的時候,要記住python內部是用Unicode儲存的
- 所有輸入要先decode,變成unicode,輸出時要encode變成想要的編碼(MacOS X/Linux下輸出為utf-8,Windows下輸出為gbk,但如果是在pycharm自己的控制檯下的話,windows下輸出為utf-8也可以正常顯示)
- 還有其他很多種古老的解決方案,比如統一用gbk,比如中轉編碼不用unicode,而用utf-8,如此種種。
- 原始碼檔案用coding: utf-8指定編碼並把檔案儲存為utf-8格式
- 為了作為__main__模組執行時不出不必要的錯誤,統一使用\n換行
- 如果需要在原始碼內嵌入漢字等非ascii字元,建議使用u字首作為unicode字串,這樣在print時可以可以不做編碼轉換,
- 否則如果控制檯編碼與原始檔編碼不一致就必須顯式轉換,通過locale.getdefaultlocale()可以獲取系統語言和編碼
- 涉及檔案路徑的最好轉換為sys.getfilesystemencoding()編碼
- unicode字串在寫入檔案時必須轉換為某種位元組編碼
- json預設支援utf-8編碼
- 儘量用utf-8和unicode,除了前面說的檔案路徑和寫入檔案等少數情況