excel處理utf-8編碼格式的csv檔案亂碼的思考
阿新 • • 發佈:2021-11-17
直接用 Excel 開啟 UTF-8 編碼的 CSV 檔案會導致漢字部分出現亂碼。
原因是 Excel 以 ANSI 格式開啟,不會做編碼識別。
開啟 UTF-8 編碼的 CSV 檔案的方法:
1) 開啟 Excel
2) 執行“資料”->“自文字”
3) 選擇 CSV 檔案,出現文字匯入嚮導
4) 選擇“分隔符號”,檔案原始格式選擇:65001:Unicode(utf-8) 下一步
5) 勾選“逗號”,去掉“ Tab 鍵”,下一步,完成
6)在“匯入資料”對話方塊裡,直接點確定
或者:
1.選擇開啟方式,選擇記事本開啟
2.用記事本開啟後,可以看到已經沒有亂碼了
3.將記事本內容另存為csv檔案,填寫另存檔案的名字,確保編碼格式為UTF-8,點選儲存
原因在哪呢?
原因是Excel以 ANSI 格式開啟,不會做編碼識別。EXCEL開啟的CSV檔案預設是ANSI編碼,如果CSV檔案的編碼方式為utf-8、Unicode等編碼可能就會出現檔案亂碼的情況。
因為微軟系列軟體是需要有bom頭才視作utf8處理的,的記事本儲存為utf8時會自動新增bom頭。
對於沒有bom頭的,會使用系統字符集處理(我猜),簡體中文是內碼表936,基本相當於GBK。
因為 excel 根本就不支援 utf-8 編碼,只支援 ANSI,要正確顯示中文的話,把檔案轉成 GBK 或 GB18030 編碼就行了。