各種格式圖片檔案頭標識分析
http://hi.baidu.com/_through/item/a4d84f0baae7756ad45a1109
圖片的格式很多,一個圖片檔案的字尾名並不能說明這個圖片的真正格式什麼,那麼如何獲取圖片的格式呢?我想到了幾個簡單但有效的方法,那就是讀取圖片檔案的檔案頭標識。我們知道各種格式的圖片的檔案頭標識識不同的,因此我們可以通過判斷檔案頭的標識來識別圖片格式。
我對各種格式的圖片檔案頭標識進行了分析,不僅查詢資料,也用十六進位制編輯器察看過圖片的檔案頭,以下是我收集、分析的結果,供大家參考。
1.JPEG
- 檔案頭標識 (2 bytes): $ff, $d8 (SOI) (JPEG 檔案標識)
- 檔案結束標識 (2 bytes): $ff, $d9 (EOI)
2.TGA
- 未壓縮的前5位元組 00 00 02 00 00
- RLE壓縮的前5位元組 00 00 10 00 00
3.PNG
- 檔案頭標識 (8 bytes) 89 50 4E 47 0D 0A 1A 0A
4.GIF
- 檔案頭標識 (6 bytes) 47 49 46 38 39(37) 61
G I F 8 9 (7) a
5.BMP
- 檔案頭標識 (2 bytes) 42 4D
B M
6.PCX
- 檔案頭標識 (1 bytes) 0A
7.TIFF
- 檔案頭標識 (2 bytes) 4D 4D 或 49 49
8.ICO
- 檔案頭標識 (8 bytes) 00 00 01 00 01 00 20 20
9.CUR
- 檔案頭標識 (8 bytes) 00 00 02 00 01 00 20 20
10.IFF
- 檔案頭標識 (4 bytes) 46 4F 52 4D
F O R M
11.ANI
- 檔案頭標識 (4 bytes) 52 49 46 46
R I F F
根據這些檔案頭標識的收集,我可以寫一個識別影象格式的模組了。但是在寫這個模組之前可以對收集到的檔案頭標識進行優化,使得程式中字串比對次數儘量的少。
1.JPEG我們知需要比對檔案頭的$ff, $d8這兩個字元,而不用讀取最後的兩個結束標識了。
2.TGA,ICO,CUR只需比對第三個與第五個字元即可。
3.PNG比對[89][50]這兩個字元。
4.GIF比對[47][49][46]與第五個字元。
到這裡,我想程式碼是不難寫的,但是為了方便大家我還是把程式碼貼出來了,如果這程式碼寫的不好,可以與我討論。您可採用下面的程式碼,但請保留版權,謝謝!
模組程式碼如下:
'列舉圖片格式種類
Public Enum ImageForm
[BMP] = 0
[JPEG] = 1
[GIF87] = 2
[GIF89] = 3
[PNG] = 4
[TGA Normal] = 5 'TGA未壓縮
[TGA RLE] = 6 'TGA經過RLE壓縮後的
[PCX] = 7
[TIFF] = 8
[ICO] = 9
[CUR] = 10
[IFF] = 11
[ANI] = 12
[Other] = 13
[FileError] = 14
End Enum
'1
http://hi.baidu.com/_through/item/a4d84f0baae7756ad45a1109
圖片的格式很多,一個圖片檔案的字尾名並不能說明這個圖片的真正格式什麼,那麼如何獲取圖片的格式呢?我想到了幾個簡單但有效的方法,那就是讀取圖片檔案的檔案頭標識。我們知道各種格式的圖片的檔案頭標識識不同的,因此我們可以通過判斷檔案頭的標識來識別圖片格式。
我對各種格式的圖片檔案頭標識進行了分析,不僅查詢資料,也用十六進位制編輯器察看過圖片的檔案頭,以下是我收集、分析的結果,供大家參考。
1.JPEG
- 檔案頭標識 (2 bytes): $ff, $d8 (SOI) (JPEG 檔案標識)
- 檔案結束標識 (2 bytes): $ff, $d9 (EOI)
2.TGA
- 未壓縮的前5位元組 00 00 02 00 00
- RLE壓縮的前5位元組 00 00 10 00 00
3.PNG
- 檔案頭標識 (8 bytes) 89 50 4E 47 0D 0A 1A 0A
4.GIF
- 檔案頭標識 (6 bytes) 47 49 46 38 39(37) 61
G I F 8 9 (7) a
5.BMP
- 檔案頭標識 (2 bytes) 42 4D
B M
6.PCX
- 檔案頭標識 (1 bytes) 0A
7.TIFF
- 檔案頭標識 (2 bytes) 4D 4D 或 49 49
8.ICO
- 檔案頭標識 (8 bytes) 00 00 01 00 01 00 20 20
9.CUR
- 檔案頭標識 (8 bytes) 00 00 02 00 01 00 20 20
10.IFF
- 檔案頭標識 (4 bytes) 46 4F 52 4D
F O R M
11.ANI
- 檔案頭標識 (4 bytes) 52 49 46 46
R I F F
根據這些檔案頭標識的收集,我可以寫一個識別影象格式的模組了。但是在寫這個模組之前可以對收集到的檔案頭標識進行優化,使得程式中字串比對次數儘量的少。
1.JPEG我們知需要比對檔案頭的$ff, $d8這兩個字元,而不用讀取最後的兩個結束標識了。
2.TGA,ICO,CUR只需比對第三個與第五個字元即可。
3.PNG比對[89][50]這兩個字元。
4.GIF比對[47][49][46]與第五個字元。
到這裡,我想程式碼是不難寫的,但是為了方便大家我還是把程式碼貼出來了,如果這程式碼寫的不好,可以與我討論。您可採用下面的程式碼,但請保留版權,謝謝!
模組程式碼如下:
'列舉圖片格式種類
Public Enum ImageForm
[BMP] = 0
[JPEG] = 1
[GIF87] = 2
[GIF89] = 3
[PNG] = 4
[TGA Normal] = 5 'TGA未壓縮
[TGA RLE] = 6 'TGA經過RLE壓縮後的
[PCX] = 7
[TIFF] = 8
[ICO] = 9
[CUR] = 10
[IFF] = 11
[ANI] = 12
[Other] = 13
[FileError] = 14
End Enum
'1