1. 程式人生 > >各種格式圖片檔案頭標識分析

各種格式圖片檔案頭標識分析

http://hi.baidu.com/_through/item/a4d84f0baae7756ad45a1109

圖片的格式很多,一個圖片檔案的字尾名並不能說明這個圖片的真正格式什麼,那麼如何獲取圖片的格式呢?我想到了幾個簡單但有效的方法,那就是讀取圖片檔案的檔案頭標識。我們知道各種格式的圖片的檔案頭標識識不同的,因此我們可以通過判斷檔案頭的標識來識別圖片格式。
     我對各種格式的圖片檔案頭標識進行了分析,不僅查詢資料,也用十六進位制編輯器察看過圖片的檔案頭,以下是我收集、分析的結果,供大家參考。

1.JPEG
- 檔案頭標識 (2 bytes): $ff, $d8 (SOI) (JPEG 檔案標識) 
- 檔案結束標識 (2 bytes): $ff, $d9 (EOI)

2.TGA
- 未壓縮的前5位元組    00 00 02 00 00
- RLE壓縮的前5位元組   00 00 10 00 00

3.PNG
- 檔案頭標識 (8 bytes)   89 50 4E 47 0D 0A 1A 0A

4.GIF
- 檔案頭標識 (6 bytes)   47 49 46 38 39(37) 61
                                     G    I    F     8    9 (7)     a

5.BMP
- 檔案頭標識 (2 bytes)   42 4D
                                     B    M

6.PCX
- 檔案頭標識 (1 bytes)   0A

7.TIFF
- 檔案頭標識 (2 bytes)   4D 4D 或 49 49

8.ICO
- 檔案頭標識 (8 bytes)   00 00 01 00 01 00 20 20

9.CUR
- 檔案頭標識 (8 bytes)   00 00 02 00 01 00 20 20

10.IFF
- 檔案頭標識 (4 bytes)   46 4F 52 4D
                                     F    O   R    M

11.ANI
- 檔案頭標識 (4 bytes)   52 49 46 46
                                    R     I     F    F

     根據這些檔案頭標識的收集,我可以寫一個識別影象格式的模組了。但是在寫這個模組之前可以對收集到的檔案頭標識進行優化,使得程式中字串比對次數儘量的少。
1.JPEG我們知需要比對檔案頭的$ff, $d8這兩個字元,而不用讀取最後的兩個結束標識了。
2.TGA,ICO,CUR只需比對第三個與第五個字元即可。
3.PNG比對[89][50]這兩個字元。
4.GIF比對[47][49][46]與第五個字元。

     到這裡,我想程式碼是不難寫的,但是為了方便大家我還是把程式碼貼出來了,如果這程式碼寫的不好,可以與我討論。您可採用下面的程式碼,但請保留版權,謝謝!

模組程式碼如下:

'列舉圖片格式種類
Public Enum ImageForm
   [BMP] = 0
   [JPEG] = 1
   [GIF87] = 2
   [GIF89] = 3
   [PNG] = 4
   [TGA Normal] = 5 'TGA未壓縮
   [TGA RLE] = 6     'TGA經過RLE壓縮後的
   [PCX] = 7
   [TIFF] = 8
   [ICO] = 9
   [CUR] = 10
   [IFF] = 11
   [ANI] = 12
   [Other] = 13
   [FileError] = 14
End Enum


'1


http://hi.baidu.com/_through/item/a4d84f0baae7756ad45a1109

圖片的格式很多,一個圖片檔案的字尾名並不能說明這個圖片的真正格式什麼,那麼如何獲取圖片的格式呢?我想到了幾個簡單但有效的方法,那就是讀取圖片檔案的檔案頭標識。我們知道各種格式的圖片的檔案頭標識識不同的,因此我們可以通過判斷檔案頭的標識來識別圖片格式。
     我對各種格式的圖片檔案頭標識進行了分析,不僅查詢資料,也用十六進位制編輯器察看過圖片的檔案頭,以下是我收集、分析的結果,供大家參考。

1.JPEG
- 檔案頭標識 (2 bytes): $ff, $d8 (SOI) (JPEG 檔案標識) 
- 檔案結束標識 (2 bytes): $ff, $d9 (EOI)

2.TGA
- 未壓縮的前5位元組    00 00 02 00 00
- RLE壓縮的前5位元組   00 00 10 00 00

3.PNG
- 檔案頭標識 (8 bytes)   89 50 4E 47 0D 0A 1A 0A

4.GIF
- 檔案頭標識 (6 bytes)   47 49 46 38 39(37) 61
                                     G    I    F     8    9 (7)     a

5.BMP
- 檔案頭標識 (2 bytes)   42 4D
                                     B    M

6.PCX
- 檔案頭標識 (1 bytes)   0A

7.TIFF
- 檔案頭標識 (2 bytes)   4D 4D 或 49 49

8.ICO
- 檔案頭標識 (8 bytes)   00 00 01 00 01 00 20 20

9.CUR
- 檔案頭標識 (8 bytes)   00 00 02 00 01 00 20 20

10.IFF
- 檔案頭標識 (4 bytes)   46 4F 52 4D
                                     F    O   R    M

11.ANI
- 檔案頭標識 (4 bytes)   52 49 46 46
                                    R     I     F    F

     根據這些檔案頭標識的收集,我可以寫一個識別影象格式的模組了。但是在寫這個模組之前可以對收集到的檔案頭標識進行優化,使得程式中字串比對次數儘量的少。
1.JPEG我們知需要比對檔案頭的$ff, $d8這兩個字元,而不用讀取最後的兩個結束標識了。
2.TGA,ICO,CUR只需比對第三個與第五個字元即可。
3.PNG比對[89][50]這兩個字元。
4.GIF比對[47][49][46]與第五個字元。

     到這裡,我想程式碼是不難寫的,但是為了方便大家我還是把程式碼貼出來了,如果這程式碼寫的不好,可以與我討論。您可採用下面的程式碼,但請保留版權,謝謝!

模組程式碼如下:

'列舉圖片格式種類
Public Enum ImageForm
   [BMP] = 0
   [JPEG] = 1
   [GIF87] = 2
   [GIF89] = 3
   [PNG] = 4
   [TGA Normal] = 5 'TGA未壓縮
   [TGA RLE] = 6     'TGA經過RLE壓縮後的
   [PCX] = 7
   [TIFF] = 8
   [ICO] = 9
   [CUR] = 10
   [IFF] = 11
   [ANI] = 12
   [Other] = 13
   [FileError] = 14
End Enum


'1