详解PNG图片的16进制文件

  • 1.概述
  • 2.特性
  • 3.文件结构
  • 3.1.文件署名域
  • 3.2.数据块
  • 3.2.1.关键数据块
  • 3.2.2辅助数据块
  • 4.举例说明
  • ==前八字节分类表==
  • ==关键数据块、辅助数据块和专用公共数据块==
  • ==tEXt和zTXt数据块中的标准关键字==


1.概述

PNG是20世纪90年代中期开始开发的图像文件存储格式,其目的是替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性。

2.特性

  1. 使用调色板技术可支持256种颜色的彩色图像。
  2. 流式读写性:图像文件格式允许连续读出和写入图像数据。
  3. 逐次逼近显示:这种特性可使在通信链路上传输图像文件的同时就在终端上显示图像,把整个轮廓显示出来之后逐步显示图像的细节,也就是先用低分辨率显示图像,然后逐步提高它的分辨率。
  4. 透明性:这个性能可使图像中某些部分不显示出来,用来创建一些有特色的图像。
  5. 辅助信息:这个特性可用来在图像文件中存储一些文本注释信息。
  6. 独立于计算机软硬件环境。
  7. 在存储上使用无损压缩。
  8. 可在一个文件中存储多幅图像。

3.文件结构

PNG图像格式文件由文件署名和数据块(chunk)组成。

3.1.文件署名域

8字节的PNG文件署名域用来识别该文件是不是PNG文件。该域的值是:

十进制数

十六进制数

137

89

80

50

78

4e

71

47

13

0d

10

0a

26

1a

10

0a

3.2.数据块

这里有两种类型的数据块.

第一种是称为关键数据块。第二种叫做辅助数据块。

每个数据块都由下表所示的的4个域组成。

名称

字节数

说明

Length(长度)

4字节

指定数据块中数据域的长度,其长度不超过(231−1)(231−1)字节

Chunk Type Code(数据块类型码)

4字节

数据块类型码由ASCII字母(A-Z和a-z)组成

Chunk Data(数据块实际内容

可变长度

存储按照Chunk Type Code指定的数据

CRC(循环冗余检测

4字节

存储用来检测是否有错误的循环冗余码

3.2.1.关键数据块

关键数据块中的4个标准数据块是:

  • 文件头数据块IHDR(header chunk):
    它包含有PNG文件中存储的图像数据的基本信息,并要作为第一个数据块出现在PNG数据流中,而且一个PNG数据流中只能有一个文件头数据块。
    文件头数据块由13字节,组成结构如下:

域的名称

字节数

说明

Width

4 bytes

图像宽度,以像素为单位

Height

4 bytes

图像高度,以像素为单位

Bit depth

1 byte

图像深度:索引彩色图像:1,2,4或8 ;灰度图像:1,2,4,8或16 ;真彩色图像:8或16

ColorType

1 byte

颜色类型:0:灰度图像, 1,2,4,8或16;2:真彩色图像,8或16;3:索引彩色图像,1,2,4或84:带α通道数据的灰度图像,8或16;6:带α通道数据的真彩色图像,8或16

Compression

method 1

byte 压缩方法(LZ77派生算法)

Filter method

1 byte

滤波器方法

Interlace method

1 byte

隔行扫描方法:0:非隔行扫描;1: Adam7(由Adam M. Costello开发的7遍隔行扫描方法)

  • 调色板数据块PLTE(palette chunk):
    它包含有与索引彩色图像((indexed-color image))相关的彩色变换数据,它仅与索引彩色图像有关,而且要放在图像数据块(image data chunk)之前。真彩色的PNG数据流也可以有调色板数据块,目的是便于非真彩色显示程序用它来量化图像数据,从而显示该图像。结构如下:

颜色

字节

意义

Red

1 byte

0 = 黑色, 255 = 红

Green

1 byte

0 = 黑色, 255 = 绿色

Blue

1 byte

0 = 黑色, 255 = 蓝色

PLTE数据块是定义图像的调色板信息,PLTE可以包含1~256个调色板信息,每一个调色板信息由3个字节组成,因此调色板数据块所包含的最大字节数为768,调色板的长度应该是3的倍数,否则,这将是一个非法的调色板。
对于索引图像,调色板信息是必须的,调色板的颜色索引从0开始编号,然后是1、2……,调色板的颜色数不能超过色深中规定的颜色数(如图像色深为4的时候,调色板中的颜色数不可以超过2^4=16),否则,这将导致PNG图像不合法。

  • 图像数据块IDAT(image data chunk):
    它存储实际的数据,在数据流中可包含多个连续顺序的图像数据块。

IDAT存放着图像真正的数据信息,因此,如果能够了解IDAT的结构,我们就可以很方便的生成PNG图像。

  • 图像结束数据IEND(image trailer chunk):
    它用来标记PNG文件或者数据流已经结束,并且必须要放在文件的尾部。

如果我们仔细观察PNG文件,我们会发现,文件的结尾12个字符看起来总应该是这样的:
00 00 00 00 49 45 4E 44 AE 42 60 82
不难明白,由于数据块结构的定义,IEND数据块的长度总是0(00 00 00 00,除非人为加入信息),数据标识总是IEND(49 45 4E 44),因此,CRC码也总是AE 42 60 82。
最后,除了表示数据块开始的IHDR必须放在最前面, 表示PNG文件结束的IEND数据块放在最后面之外,其他数据块的存放顺序没有限制。

3.2.2辅助数据块

PNG文件格式规范制定的10个辅助数据块是:

  1. 背景颜色数据块bKGD(background color)。
  2. 基色和白色度数据块cHRM(primary chromaticities and white point)。所谓白色度是指当R=G=B=最大值时在显示器上产生的白色度。
  3. 图像γ数据块gAMA(image gamma)。
  4. 图像直方图数据块hIST(image histogram)。
  5. 物理像素尺寸数据块pHYs(physical pixel dimensions)。
  6. 样本有效位数据块sBIT(significant bits)。
  7. 文本信息数据块tEXt(textual data)。
  8. 图像最后修改时间数据块tIME (image last-modification time)。
  9. 图像透明数据块tRNS (transparency)。
  10. 压缩文本数据块zTXt (compressed textual data)。

4.举例说明

为了便于研究,我在本地找了个8*8像素的图片:

用十六进制打开后是这样的:

00

01

02

03

04

05

06

07

08

09

0a

0b

0c

0d

0e

0f

89

50

4e

47

0d

0a

1a

0a

00

00

00

0d

49

48

44

52

00

00

00

08

00

00

00

08

08

06

00

00

00

c4

0f

be

8b

00

00

00

01

73

52

47

42

00

ae

ce

1c

e9

00

00

00

04

67

41

4d

41

00

00

b1

8f

0b

fc

61

05

00

00

00

09

70

48

59

73

00

00

16

25

00

00

16

25

01

49

52

24

f0

00

00

00

11

49

44

41

54

28

53

63

f8

4f

00

8c

08

05

ff

ff

03

00

84

b5

ff

01

98

b2

ba

5c

00

00

00

00

49

45

4e

44

ae

42

60

82

接下来我们试着分析一下:

首先是八个字节的文件头标志,标识着png文件:

89 50 4e 47 0d 0a 1a 0a

接下来的地方就是IHDR数据块了:

00 00 00 0d 说明IHDR头块长为13

49 48 44 52 IHDR标识(ascii码为IHDR)

下面是IHDR数据块的实际内容

00 00 00 08 图像的宽 8像素

0000 0008图像的高 8像素

08 表示色深,这里是2^8=256,即这是一个256色的图像

06 颜色类型,查表可知这是带α通道数据的真彩色图像

00 PNG Spec规定此处总为0(非0值为将来使用更好的压缩方法预留),表示使压缩方法(LZ77派生算法)

00 PNG Spec规定此处总为0(非0值为将来使用更好的压缩方法预留),表示使压缩方法(LZ77派生算法)

00 非隔行扫描

c4 0f be 8b CRC校验字段

IEND数据块,居于最后

00 00 00 00 49 45 4E 44 AE 42 60 82

前八字节分类表

扩展名

文件头标识(HEX)

文件描述

7z

37 7A BC AF 27 1C

7-ZIP compressed file

doc

0D 44 4F 43

DeskMate Document file

doc

12 34 56 78 90 FF

MS Word 6.0

doc

31 BE 00 00 00 AB 00 00

MS Word for DOS 6.0

doc

7F FE 34 0A

MS Word

HDMP

4D 44 4D 50 93 A7

Windows heap dump file

hdr

23 3F 52 41 44 49 41 4E 43 45 0A

adiance High Dynamic Range image file

html

3C 21 44 4F 43 54

HyperText Markup Language 3

html

3C 48 54 4D 4C 3E

HyperText Markup Language 2

html

3C 68 74 6D 6C 3E

HyperText Markup Language 1

html

68 74 6D 6C 3E

HTML

img

00 01 00 08 00 01 00 01 01

Ventura Publisher/GEM VDI Image Format Bitmap file

JAR

4A 41 52 43 53 00

JARCS compressed archive

jar

5F 27 A8 89

JAR Archive File

MP3

FF FB 50

mp4

00 00 00 18 66 74 79 70 33 67 70 35

MPEG-4 video files

PNG

89 50 4E

PNG

89 50 4E 47

png

89 50 4E 47 0D 0A

PNG Image File

png

89 50 4E 47 0D 0A 1A 0A

PNG Image File

PDF

25 50 44

PPT

D0 CF 11

xls

09 02 06 00 00 00 10 00 B9 04 5C 00

MS Excel v2

xls

09 04 06 00 00 00 10 00 F6 05 5C 00

MS Excel v4

zip

50 4B 30 30

ZIP Archive (outdated)

Zip

50 4B 30 30 50 4B 03 04

WINZIP Compressed

通过检查文件的十六进制头来判断文件实际的类型了。

关键数据块、辅助数据块和专用公共数据块

数据块符号

数据块名称

多数据块

可选否

位置限制

IHDR

文件头数据块



第一块

cHRM

基色和白色点数据块



在PLTE和IDAT之前

gAMA

图像γ数据块



在PLTE和IDAT之前

sBIT

样本有效位数据块



在PLTE和IDAT之前

PLTE

调色板数据块



在IDAT之前

bKGD

背景颜色数据块



在PLTE之后IDAT之前

hIST

图像直方图数据块



在PLTE之后IDAT之前

tRNS

图像透明数据块



在PLTE之后IDAT之前

oFFs

专用公共数据块



在IDAT之前

pHYs

物理像素尺寸数据块



在IDAT之前

sCAL

专用公共数据块



在IDAT之前

IDAT

图像数据块



与其他IDAT连续

tIME

图像最后修改时间数据块



无限制

tEXt

文本信息数据块



无限制

zTXt

压缩文本数据块



无限制

fRAc

专用公共数据块



无限制

gIFg

专用公共数据块



无限制

gIFt

专用公共数据块



无限制

gIFx

专用公共数据块



无限制

IEND

图像结束数据



最后一个数据块

tEXt和zTXt数据块中的标准关键字

关键字

说明

Title

图像名称或者标题

Author

图像作者名

Description

图像说明

Copyright

版权声明

CreationTime

原图创作时间

Software

创作图像使用的软件

Disclaimer

弃权

Warning

图像内容警告

Source

创作图像使用的设备

Comment

各种注释