1. 程式人生 > >檢視檔案的編碼格式的方法

檢視檔案的編碼格式的方法

這裡指的文字是用於Windows系統中的副檔名為.txt的檔案。

Notepad(記事本)只支援四種格式:ANSI/Unicode/Unicode big endian/UFT-8,

在Delphi中如何判斷與讀取這些不同格式的文字呢?

首先,不同編碼的文字,是根據文字的前兩個位元組來定義其編碼格式的。定義如下:

ANSI:        無格式定義;

Unicode:       前兩個位元組為FFFE;

Unicode big endian: 前兩位元組為FEFF; 

UTF-8:        前兩位元組為EFBB; 

這樣通過前面兩個位元組就可以判定出檔案的具體格式,

知道了各種編碼格式的區別,寫程式碼就容易了,以下是我在一個軟體中寫的處理程式碼:

(注意,Delphi的TMemo/TRichEdit只支援ANSI的文字檔案,其它編碼格式的檔案需要

自行寫程式碼轉換成GB2312或BIG5,方能正確顯示)
其次:可以使用linux的od命令,將檔案轉成需要的格式來檢視檔案的編碼是什麼。