http协议标识描述
1. 标识
2. 请求包
主要包含三个部分:请求行(line),请求头(header),请求正文(body)
请求行:主要包含三部分Method,Uri,协议/版本,各部分之间用空格(sp)分割,整个请求头用CRLF分割,(比如:POST /1.0.0/_health_check HTTP/1.1 CRLF)
请求头:格式为(name:value)用于客户端请求的描述信息。header之间以CRLF进行分割。最后一个header会多加一个CRLF。(比如:Connection: keep-alive CRLF CRLF)。
请求正文(body):里面主要是Post提交的数据(可支持多种格式,格式在Content-Type定义,长度是在Content-Length里面定义)。
1.3 响应包
主要包含三部分:状态行(line),响应头(header),响应正文(body)
状态行(line):包含三部分: http版本,服务器返回状态码,描述信息。以CRLF进行分割。(比如:HTTP/1.1200 OK CRLF)
响应头(header):格式为(name : value),用于服务器返回的描述信息。header之间以CRLF进行分割。最后一个header会多加一个CRLF(比如:Content-Type: textIhtml CRLF Content-Encoding:gzip CRLF CRLF)。
响应正文(body):里面主要是返回数据(可支持多种格式,格式在Content-Type定义,长度是在Content-Length里面定义)。
chunked介绍
1. 背景
HTTP协议通常使用Content-Length来标识body的长度,在服务器端,需要先申请对应长度的buffer,然后再赋值。如果需要一边生产数据一边发送数据,就需要使用"Transfer-Encoding: chunked" 来代替Content-Length,也就是对数据进行分块传输。
2. Content-Length 描述
1: http server接收数据时,发现header中有Content-Length属性,则读取Content-Length的值,确定需要读取body的长度。
2: http server发送数据时,根据需要发送byte的长度,在header中增加Content-Length项,其中value为byte的长度,然后将byte数据当做body发送到客户端。
3. chunked描述
1: http server接收数据时,发现header中有Transfer-Encoding: chunked,则会按照truncked协议分批读取数据。
2: http server发送数据时,如果需要分批发送到客户端,则需要在header中加上Transfer-Encoding:chunked,然后按照truncked协议分批发送数据。
4. truncked协议
1:主要包含三部分: chunk,last-chunk和trailer。如果分多次发送,则chunk有多份。
2: chunk主要包含大小和数据,大小表示这个这个trunck包的大小,使用16进制标示。其中trunk之间的分隔符为CRLF。
3∶通过last-chunk来标识chunk发送完成。一般读取到last-chunk(内容为0)的时候,代表chunk发送完成。
4: trailer表示增加header等额外信息,一般情况下header是空。通过CRLF来标识整个chunked数据发送完成。
5. 优点
1:假如body的长度是10K,对于Content-Length则需要申请10K连续的buffer,而对于Transfer-Encoding:chunked可以申请1k的空间,然后循环使用10次。节省了内存空间的开销。
2:如果内容的长度不可知,则可使用trunked方式能有效的解决Content-Length的问题
3: http服务器压缩可以采用分块压缩,而不是整个快压缩。分块压缩可以一边进行压缩,一般发送数据,来加快数据的传输时间。
6. 缺点
1: truncked协议解析比较复杂。
2:在http转发的场景下(比如nginx)难以处理,比如如何对分块数据进行转发。