* 音視訊入門文章目錄 *

PNG 檔案格式解析

PNG 影象格式檔案由一個 8 位元組的 PNG 檔案署名域和 3 個以上的後續資料塊（IHDR、IDAT、IEND）組成。

PNG 檔案包括 8 位元組檔案署名（89 50 4E 47 0D 0A 1A 0A，十六進位制），用來識別 PNG 格式。

用十六進位制檢視器開啟任意一個 PNG 檔案，都是可以看到這樣的頭部:

PNG 定義了兩種型別的資料塊：一種是 PNG 檔案必須包含、讀寫軟體也都必須要支援的關鍵塊（critical chunk）；另一種叫做輔助塊（ancillary chunks），PNG 允許軟體忽略它不認識的附加塊。這種基於資料塊的設計，允許 PNG 格式在擴充套件時仍能保持與舊版本相容。

資料塊總覽

下表就是 PNG 中資料塊的類別，關鍵資料塊部分突出顯示以區分：

資料塊符號	資料塊名稱	多資料塊	是否可選	位置限制
`IHDR`	`檔案頭資料塊`	`否`	`否`	`第一塊`
cHRM	基色和白色點資料塊	否	是	在PLTE和IDAT之前
gAMA	影象γ資料塊	否	是	在PLTE和IDAT之前
sBIT	樣本有效位資料塊	否	是	在PLTE和IDAT之前
`PLTE`	`調色盤資料塊`	`否`	`是`	`在IDAT之前`
bKGD	背景顏色資料塊	否	是	在PLTE之後IDAT之前
hIST	影象直方圖資料塊	否	是	在PLTE之後IDAT之前
tRNS	影象透明資料塊	否	是	在PLTE之後IDAT之前
oFFs	(專用公共資料塊)	否	是	在IDAT之前
pHYs	物理畫素尺寸資料塊	否	是	在IDAT之前
sCAL	(專用公共資料塊)	否	是	在IDAT之前
`IDAT`	`影象資料塊`	`是`	`否`	`與其他IDAT連續`
tIME	影象最後修改時間資料塊	否	是	無限制
tEXt	文字資訊資料塊	是	是	無限制
zTXt	壓縮文字資料塊	是	是	無限制
fRAc	(專用公共資料塊)	是	是	無限制
gIFg	(專用公共資料塊)	是	是	無限制
gIFt	(專用公共資料塊)	是	是	無限制
gIFx	(專用公共資料塊)	是	是	無限制
`IEND`	`影象結束資料`	`否`	`否`	`最後一個數據塊`

我們目前只需關注關鍵資料塊即可。

資料塊中有 4 個關鍵資料塊：

檔案頭資料塊 IHDR（header chunk）：包含有影象基本資訊，作為第一個資料塊出現並只出現一次。
調色盤資料塊 PLTE（palette chunk）：必須放在影象資料塊之前。
影象資料塊 IDAT（image data chunk）：儲存實際影象資料。PNG 資料允許包含多個連續的影象資料塊。
影象結束資料 IEND（image trailer chunk）：放在檔案尾部，表示 PNG 資料流結束。

資料塊連起來，大概這個樣子：

PNG 識別符號	PNG 資料塊(IHDR)	PNG 資料塊(其他型別資料塊)	…	PNG 結尾資料塊(IEND)

資料塊結構

PNG 檔案中，每個資料塊（比如IHDR，IDAT等）由4個部分組成：

名稱	位元組數	說明
Length (長度)	4 位元組	指定資料塊中資料域的長度，其長度不超過(2^31－1)位元組
Chunk Type Code (資料塊型別碼)	4 位元組	資料塊型別碼由 ASCII 字母(A-Z和a-z)組成
Chunk Data (資料塊資料)	可變長度	儲存按照 Chunk Type Code 指定的資料
CRC (迴圈冗餘檢測)	4 位元組	儲存用來檢測是否有錯誤的迴圈冗餘碼

CRC(cyclic redundancy check) 域中的值是對 Chunk Type Code 域和 Chunk Data 域中的資料進行計算得到的。
注意：Length 值的是除：length 本身，Chunk Type Code，CRC 外的長度，也就是 Chunk Data 的長度。

資料塊-檔案頭資料塊 IHDR

它包含 PNG 檔案中儲存的影象資料的基本資訊，並要作為第一個資料塊出現在 PNG 資料流中，而且一個 PNG 資料流中只能有一個檔案頭資料塊。

檔案頭資料塊由 13 位元組組成：

域的名稱	位元組數	說明
Width	4 bytes	影象寬度，以畫素為單位
Height	4 bytes	影象高度，以畫素為單位
Bit depth	1 byte	影象深度： `索引彩色影象：1，2，4或8` `灰度影象：1，2，4，8或16` `真彩色影象：8或16`
ColorType	1 byte	顏色型別：`0：灰度影象, 1，2，4，8或16` `2：真彩色影象，8或16` `3：索引彩色影象，1，2，4或8` `4：帶α通道資料的灰度影象，8或16` `6：帶α通道資料的真彩色影象，8或16`
Compression method	1 byte	PNG Spec 規定此處總為 0，表示使用壓縮方法(LZ77派生演算法)
Filter method	1 byte	PNG Spec 規定此處總為 0，濾波器方法
Interlace method	1 byte	隔行掃描方法：`0：非隔行掃描` `1： Adam7(由Adam M. Costello開發的7遍隔行掃描方法)`

用十六進位制檢視器開啟一個 PNG 檔案:

十六進位制	說明
00 00 00 0D	資料塊長度 13 位元組
49 48 44 52	資料塊型別碼 “IHDR” 的 ASCII 字母
00 00 04 1D	影象寬度 1053
00 00 02 B3	影象高度 691
08	影象深度 8
06	帶α通道資料的真彩色圖
00	壓縮方法
00	濾波器方法
00	隔行掃描方法：00非隔行掃描
52 C3 75 3A	CRC (迴圈冗餘檢測)

資料塊-調色盤資料塊 PLTE

包含有與索引彩色影象(indexed-color image)相關的彩色變換資料，它僅與索引彩色影象有關，而且要放在影象資料塊(image data chunk)之前。

PLTE 資料塊是定義影象的調色盤資訊，PLTE 可以包含 1~256 個調色盤資訊，每一個調色盤資訊由 3 個位元組組成：

顏色	位元組	意義
Red	1 byte	0 = 黑色, 255 = 紅
Green	1 byte	0 = 黑色, 255 = 綠色
Blue	1 byte	0 = 黑色, 255 = 藍色

調色盤的長度應該是 3 的倍數，否則，這將是一個非法的調色盤。
對於索引影象，調色盤資訊是必須的，調色盤的顏色索引從 0 開始編號，然後是 1、2……，調色盤的顏色數不能超過色深中規定的顏色數（如影象色深為 4 的時候，調色盤中的顏色數不可以超過 2^4=16），否則，這將導致 PNG 影象不合法。
真彩色影象和帶 α 通道資料的真彩色影象也可以有調色盤資料塊，目的是便於非真彩色顯示程式用它來量化影象資料，從而顯示該影象。

用十六進位制檢視器開啟一個索引影象 PNG 檔案:

十六進位制	說明
00 00 00 27	資料塊長度 39 位元組
50 4C 54 45	資料塊型別碼 “PLTE” 的 ASCII 字母
`B7 00 34` `FF 99 00` `60 00 73` `FF 0F 00` `FF ED 00` `09 00 B2` `FF 66 00` `FF 3B 00` `E2 00 15` `8B 00 54` `FF C1 00` `33 00 99` `FF FF 00`	調色盤顏色 13 個
48 29 75 2C	CRC (迴圈冗餘檢測)

預覽調色盤中的顏色：

資料塊-影象資料塊 IDAT

它儲存實際的資料，在資料流中可包含多個連續順序的影象資料塊。

IDAT 存放著影象真正的資料資訊，因此，如果能夠了解 IDAT 的結構，我們就可以很方便的生成 PNG 影象。

用十六進位制檢視器開啟一個索引影象 PNG 檔案:

十六進位制	說明
00 00 00 D3	資料塊長度 211 位元組
49 44 41 54	資料塊型別碼 “IDAT” 的 ASCII 字母
78 9C ......	壓縮的資料 211 位元組，LZ77 派生壓縮方法
52 98 5D 9D	CRC (迴圈冗餘檢測)

影象資料塊 IDAT 細節在本文下半部分有詳細分析

資料塊-影象結束資料 IEND

它用來標記 PNG 檔案或者資料流已經結束，並且必須要放在檔案的尾部。

如果我們仔細觀察 PNG 檔案，我們會發現，檔案的結尾 12 個字元看起來總應該是這樣的：

00 00 00 00 49 45 4E 44 AE 42 60 82

用十六進位制檢視器開啟一個 PNG 檔案:

由於資料塊結構的定義，IEND 資料塊的長度總是 0（00 00 00 00，除非人為加入資訊），資料標識總是 IEND（49 45 4E 44），因此，CRC 碼也總是 AE 42 60 82。

影象資料塊 IDAT 細節

IDAT 壓縮資料細節

在 PNG Spec 壓縮演算法部分:

PNG compression method 0 is deflate/inflate compression with a sliding window (which is an upper bound on the distances appearing in the deflate stream) of at most 32768 bytes. Deflate compression is an LZ77 derivative [ZL].

Deflate-compressed datastreams within PNG are stored in the "zlib" format, which has the structure:

- zlib compression method/flags code    1 byte
- Additional flags/check bits   1 byte
- Compressed data blocks    n bytes
- Check value   4 bytes

Further details on this format are given in the zlib specification [RFC-1950].

PNG 使用 DEFLATE 壓縮演算法。
DEFLATE 是同時使用了 LZ77 演算法與哈夫曼編碼（Huffman Coding）的一個無損資料壓縮演算法。
DEFLATE 壓縮的資料以 zlib 格式儲存。

    zlib(RFC1950):一種格式，是對 deflate 進行了簡單的封裝，他也是一個實現庫(delphi中有zlib,zlibex)
    gzip(RFC1952):一種格式，也是對 deflate 進行的封裝。

    gzip = gzip 頭 + deflate 編碼的實際內容 + gzip 尾
    zlib = zlib 頭 + deflate 編碼的實際內容 + zlib 尾

提取&解壓 IDAT 中壓縮資料

Windows 上可以用 [hexeditor](https://www.hhdsoftware.com/free-hex-editor)
Mac 上可以用 [hexfiend](http://ridiculousfish.com/hexfiend/)、[Hopper Disassembler](https://www.hopperapp.com/)

使用 zlib 解壓 78 9C ...... 壓縮的資料位元組：

#include <stdio.h>
#include <stdlib.h>
#include <stdint.h>
#include "zlib.h"

int main() {
    FILE *inFile = fopen("/Users/staff/Desktop/indexed-color-image.data", "rb");
    FILE *outFile = fopen("/Users/staff/Desktop/indexed-color-image-uncompress.data", "wb");
    
    fseek(inFile, 0L, SEEK_END);
    long size = ftell(inFile);
    fseek(inFile, 0L, SEEK_SET);

    uint8_t dataBuf[size];
    fread(dataBuf, size, 1, inFile);
    printf("壓縮檔案大小：%ld\n", size);

    uint8_t destBuf[1500000]={0};
    uint32_t destLen = 0;

    uncompress(destBuf, &destLen, dataBuf, size);
    printf("解壓後大小：%d\n", destLen);

    fwrite(destBuf, destLen, 1, outFile);

    fflush(outFile);
    fclose(inFile);
    fclose(outFile);

    return 0;
}

分析解壓後的資料

在 PNG Spec 7.1 Integers and byte order

All integers that require more than one byte shall be in network byte order (as illustrated in figure 7.1): the most significant byte comes first, then the less significant bytes in descending order of significance (MSB LSB for two-byte integers, MSB B2 B1 LSB for four-byte integers). The highest bit (value 128) of a byte is numbered bit 7; the lowest bit (value 1) is numbered bit 0. Values are unsigned unless otherwise noted. Values explicitly noted as signed are represented in two's complement notation.

PNG 使用網路位元組序 大端位元組序（Big Endian）。

在 PNG Spec 7.2 Scanlines

In PNG images of colour type 0 (greyscale) each pixel is a single sample, which may have precision less than a byte (1, 2, or 4 bits). These samples are packed into bytes with the leftmost sample in the high-order bits of a byte followed by the other samples for the scanline.

In PNG images of colour type 3 (indexed-colour) each pixel is a single palette index. These indices are packed into bytes in the same way as the samples for colour type 0.

PNG 影象深度小於 1 位元組，將會被 packed into bytes。

在 PNG Spec 7.3 Filtering

PNG allows the scanline data to be filtered before it is compressed. Filtering can improve the compressibility of the data. The filter step itself results in a sequence of bytes of the same size as the incoming sequence, but in a different representation, preceded by a filter type byte. Filtering does not reduce the size of the actual scanline data. All PNG filters are strictly lossless.

Different filter types can be used for different scanlines, and the filter algorithm is specified for each scanline by a filter type byte. The filter type byte is not considered part of the image data, but it is included in the datastream sent to the compression step. An intelligent encoder can switch filters from one scanline to the next. The method for choosing which filter to employ is left to the encoder.

每一掃描行前有一位元組用於指定過濾器型別。

在 PNG Spec Filters:

Filtering transforms the PNG image with the goal of improving compression. PNG allows for a number of filter methods. All the reduced images in an interlaced image shall use a single filter method. Only filter method 0 is defined by this International Standard. Other filter methods are reserved for future standardization (see 4.9 Extension and registration). Filter method 0 provides a set of five filter types, and individual scanlines in each reduced image may use different filter types.
。。。。。。

檔案頭資料塊 IHDR 中 Filter method 過濾方法只能是 0。
Filter method=0 定義了 5 種 Filter Type 過濾器型別: 0:None、1:Sub、2:Up、3:Average、4:Paeth。

當 PNG 圖片是索引影象時(下圖資料：影象深度: 4 尺寸 256X256 過濾器型別: 0:None 隔行掃描方法：0：非隔行掃描)：

indexed-color-image.png

每個高亮區域前面一個位元組 00 代表 過濾器型別 : 0:None 【PNG Spec 7.3 Filtering】【 PNG Spec Filters】。
如果高亮區域前面一個位元組不是 00，高亮區將不是掃描行索引資料，需要參考【PNG Spec 9.2 Filter types for filter method 0】
每種顏色高亮顯示的部分 128 位元組 是一個掃描行顏色索引資料，因為 影象深度：4，所以每個位元組代表兩個顏色索引【PNG Spec 7.2 Scanlines】。
如位元組 55 是十六進位制，二進位制為 01010101，前四 bit 位代表一個顏色索引 0101 十進位制為 5，後四 bit 位代表一個顏色索引 0101 十進位制為 5 。

當 PNG 圖片是真彩圖像時(下圖資料：影象深度: 8 尺寸 70X70 過濾器型別: 0:None 隔行掃描方法：0：非隔行掃描)：

true-color-image.png

每個高亮區域前面一個位元組 00 代表 過濾器型別 : 0:None 【PNG Spec 7.3 Filtering】【 PNG Spec Filters】。
如果高亮區域前面一個位元組不是 00，高亮區將不是掃描行顏色資料，需要參考【PNG Spec 9.2 Filter types for filter method 0】
每種顏色高亮顯示的部分 210 位元組 是一個掃描行顏色資料，因為 真彩圖片 影象深度：8，所以每三個位元組代表一個畫素顏色。
如位元組 FF 00 00，代表一個畫素 RGB 顏色。

下一步，將用程式碼手動生成一張 PNG 圖片，文章目錄：* 音視訊入門文章目錄 *。

所有可能存在問題的答案：PNG Specification。

程式碼：
demos/demos-zlib

參考資料：

PNG 檔案格式詳解

PNG、JPEG、BMP等幾種圖片格式詳解（一）—— PNG

詳解PNG檔案結構

《PNG檔案格式》（二）PNG檔案格式分析

圖片知識梳理（一）: PNG檔案結構

隱寫技巧——利用PNG檔案格式隱藏Payload

Portable Network Graphics (PNG) Specification and Extensions

gzip,deflate,zlib辨析

Zlib庫的安裝與使用

內容有誤？聯絡作者：

本文由部落格一文多發平臺 OpenWrite 釋出！

相關推薦

音視訊入門-11-PNG檔案格式詳解

* 音視訊入門文章目錄 * PNG 檔案格式解析 PNG 影象格式檔案由一個 8 位元組的 PNG 檔案署名域和 3 個以上的後續資料塊（IHDR、IDAT、IEND）組成。 PNG 檔案包括 8 位元組檔案署名（89 50 4E 47 0D 0A 1A 0A，十六進位制），用來識別 PNG 格式。用十六進

png檔案格式詳解【轉】

5.2.2 PNG影象檔案儲存結構（1） PNG檔案儲存結構的格式可以在http://www.w3.org/TR/REC-png.htm上找到定義。 BMP檔案總體上由兩部分組成，分別是PNG檔案標誌和資料塊（chunks），如表5-8所示。其中資料塊分為兩類：關鍵資料塊（cri

PNG檔案格式詳解

                PNG檔案結構分析(上：瞭解PNG檔案儲存格式)前言我們都知道，在進行J2ME的手機應用程式開發的時候，在圖片的使用上，我們可以使用PNG格式的圖片（甚至於在有的手機上，我們只可以使用PNG格式的圖片），儘管使用圖片可以為我們的應用程式增加不少亮點，然而，只支援PNG格式的圖片

PE檔案格式詳解（六）

0x00 前言   前面兩篇講到了輸出表的內容以及涉及如何在hexWorkShop中找到輸出表及輸入DLL，感覺有幾個地方還是沒有理解好，比如由資料目錄表DataDirectory[16]找到輸出表表後以為找到輸入DLL就完了，其實這一流程的最終功能是通過輸入DLL找到輸入DLL呼叫的函

PE檔案格式詳解（五）

0x00 前言   前一篇瞭解了區塊虛擬地址和檔案地址轉換的相關知識，這一篇該把我們所學拿出來用用了。這篇我們將瞭解更為重要的一個知識點——輸入表和輸出表的知識。 0x01 輸入表   首先我們有疑問。這個輸入表是啥？為啥有輸入表？其實輸入表就是記錄PE輸入函式相

PE檔案格式詳解（四）

PE檔案格式詳解（四） 0x00 前言   上一篇介紹了區塊表的資訊，以及如何在hexwrokshop找到區塊表。接下來，我們繼續深入瞭解區塊，並且學會檔案偏移和虛擬地址轉換的知識。 0x01 區塊對齊值   首先我們要知道啥事區塊對齊？為啥要區塊對齊？這個問題

Class 檔案格式詳解

Class 檔案格式詳解 Write once, run everywhere!，我們都知道這是 Java 著名的宣傳口號。不同的作業系統，不同的 CPU 具有不同的指令集，如何做到平臺無關性，依靠的就是 Java 虛擬機器。計算機永遠只能識別 0 和 1組成的二進位制檔案，虛擬機器就是我們編寫的程式碼和計

Android逆向之旅---SO(ELF)檔案格式詳解

第一、前言從今天開始我們正式開始Android的逆向之旅，關於逆向的相關知識，想必大家都不陌生了，逆向領域是一個充滿挑戰和神祕的領域。作為一名Android開發者，每個人都想去探索這個領域，因為一旦你破解了別人的內容，成就感肯定爆棚，不過相反的是，我們不僅要研究破解之道，也要

[一]class 檔案淺析 .class檔案格式詳解欄位方法屬性常量池欄位 class檔案屬性表資料型別資料結構

ClassFile { u4 magic;//唯一作用是確定這個檔案是否為一個能被虛擬機器所接受的class檔案。魔數值固定為0xCAFEBABE，不會改變 u2 minor_version;//唯一作用是確定這個檔案是否為一個能被虛擬機器所接受的class檔案。魔數值固定為0xCAFEBABE，不會

Android 音視訊開發(六)： MediaCodec API 詳解

在學習了Android 音視訊的基本的相關知識，並整理了相關的API之後，我們應該對基本的音視訊有一定的輪廓了。下面開始接觸一個Android音視訊中相當重要的一個API： MediaCodec。一、MediaCodec API介紹 MediaCodec可以處理具體的視

s19檔案格式詳解

1.概述為了在不同的計算機平臺之間傳輸程式程式碼和資料，摩托羅拉將程式和資料檔案以一種可列印的格式(ASCII格式)編碼成s格式檔案。s格式檔案是Freescale推薦使用的標準檔案傳送格式。編譯完成之後，FreescaleCodeWarrior編譯器將在bin資料夾下自動生成“*.abs.s19”檔案，

Linux下可執行檔案格式詳解

Linux下面，目標檔案、共享物件檔案、可執行檔案都是使用ELF檔案格式來儲存的。程式經過編譯之後會輸出目標檔案，然後經過連結可以產生可執行檔案或者共享物件檔案。Linux下面使用的ELF檔案和Windows作業系統使用的PE檔案都是從Unix系統的COFF檔案格式演化來的

TIFF影象檔案格式詳解(3)

基本TIFF TAGS 本頁主要摘自 http://www.awaresystems.be/imaging/tiff/tifftags/baseline.html。每一個TAG均有原始連結，可以點選檢視詳細的描述。這些基本Tag是所有TIFF編解碼器必須支援的Tag

SAM檔案格式詳解

生物資訊上的東西，由於發展的時間不長，所以各種標準都不算是廣泛傳播。尤其是檔案格式之類的，中文版的資料很少，不少英文版的說明也不是很清晰。這裡對SAM格式進行一下解釋，希望對新人有所幫助。如下是SAM檔案中的一行 FCC0YG3ACXX:2:1

GZIP壓縮原理分析（04）——第三章 gzip檔案格式詳解（三02） gzip檔案頭

檔案頭由固定長度的部分和擴充套件部分組成，擴充套件部分不一定存在，尤其是網路傳輸使用的HTTP壓縮，如果使用了gzip格式，那麼對應的壓縮報文一般都不帶擴充套件部分。gzip檔案格式通過將頭部中定長部

TIFF影象檔案格式詳解

1 什麼是TIFF？ TIFF是Tagged Image File Format的縮寫。在現在的標準中，只有TIFF存在，其他的提法已經捨棄不用了。做為一種標記語言，TIFF與其他檔案格式最大的不同在於除了影象資料，它還可以記錄很多影象的其他資訊。它記錄影象資料的方式也

【Three.js:3D模型】【轉載】OBJ檔案格式詳解

轉載：3D中的OBJ檔案格式詳解常見到的*.obj檔案有兩種：第一種是基於COFF(Common Object File Format)格式的OBJ檔案(也稱目標檔案)，這種格式用於編譯應用程式；第二種是Alias|Wavefront公司推出的OBJ模型檔案。本文對第二種ob

PE檔案格式詳解（一）

在本文中，我並不打算大講特講PE檔案的構成是什麼，每個欄位是什麼意思，這些資料可以說在網上是浩瀚如海，到處都是的，用google一搜，開啟一看，基本講解的都是大同小異。由於pe檔案的結構比較龐大，結構中套結構，有的結構多達30多個欄位，光看這些欄位都讓人夠

PE檔案格式詳解(上)

Windows NT 3.1引入了一種名為PE檔案格式的新可執行檔案格式。PE檔案格式的規範包含在了MSDN的CD中（Specs and Strategy, Specifications, Windows NT File Format Specifications），

Sam&bam檔案格式詳解

在SAM輸出的結果中每一行都包括十二項通過Tab分隔（\t），從左到右分別是：1 QNAME,序列的名字（Read的名字）2 FLAG, 概括出一個合適的標記，各個數字分別代表1 序列是一對序列中的一個2 比對結果是一個pair-end比對的末端4 沒有找到位點8 這個序列是p

音視訊入門-11-PNG檔案格式詳解