第3章 HTTP报文内的HTTP信息


1.用于HTTP协议交互的信息被称为HTTP报文。

 

 2.请求端的HTTP报文叫做请求报文,响应端的叫做响应报文。

 

 3.HTTP报文大致可分为报文首部和报文主体两块。通常,并不一定要有报文主体。

 

 4.HTTP报文结构

 报文首部

 空行(CR+LF)

 报文主体

 

 CR:Carriage Return,回车符:16进制0x0d

 LF:Line Feed,换行符:16进制0x0a

 

 5.请求报文首部结构:

 请求行

 请求首部字段

 通用首部字段

 实体首部字段

 其他

 

 6.响应报文首部结构:

 状态行

 响应首部字段

 通用首部字段

 实体首部字段

 其他

 

 7.首部内容同以下数据组成

 请求行:请求的方法,请求URI和HTTP版本

 状态行:响应结果状态码,原因短语和HTTP版本

 首部字段:请求和响应的各种条件和属性的种类首部(通用、请求、响应、实体首部四种)

 其他:可能包含HTTP的RFC里未定义的首部(Cookie等)

 

 8.报文主体和实体主体的差异

 报文(message)

 是HTTP通信中的基本单位,由8位组字节流组成,通过HTTP通信传输。

 

 实体(entity)

 作为请求或响应的有效载荷数据(补充项)被传输,其内容由实体首部和实体主体组成。

 

 9.通常,报文主体等于实体主体。只有当传输中进行编码操作时,实体主体的内容发生变化,才导致它和报文主体产生差异。

 

 10.常用的内容编码有:

 gzip(GNU zip)

 compress(UNIX系统的标准压缩)

 deflate(zlib)

 identity(不进行编码)

 

 11.分块传输编码:把实体主体分块后传输。

 每一块都会用十六进制来标记块的大小,而实体主体的最后一块会作用"0(CR+LF)"来标记

 

 12.发送多种数据的多部分对象集合

 多部分对象集合包含的对象如下:

 multipart/form-data 在web表单文件上传时使用

 multipart/byteranges 状态码206响应报文包含了多个范围的内容时使用

 

 13.获取部分内容的范围请求

 执行范围请求时,会用到首部字段Range来指定资源的byte范围:

 5001~10000字节

 Range:bytes=5001-10000

 

 从5001字节之后全部的

 Range:bytes=5001-

 

 从一开始到3000字节和5000~7000字节的多重范围

 Range:bytes=-3000,5000-7000