HTTP的原理和工作机制

原创

webor2006 2019-01-26 16:57:00 ©著作权

文章标签 服务器客户端表单 文章分类 代码人生

©著作权归作者所有：来自51CTO博客作者webor2006的原创作品，请联系作者获取转载授权，否则将追究法律责任

HTTP到底是什么？

两种最直观的印象：
①、浏览器地址栏输入地址，打开网页：

②、Android中发送网络请求，返回对应的内容：
HyperText Transfer Protocal 超文本传输协议。
HyperText，又叫超文本：在电脑中显示的、含有可以指向其它文本的链接的文本，其实也就是我们熟知的HTML啦：

HTTP的工作方式：

首先在浏览器中输入一个网页：

HTTP的原理和工作机制_客户端_04

然后服务器处理请求，接着给出结果反馈，如下：

HTTP的原理和工作机制_表单_05

然后浏览器根据响应做出渲染显示，也就是我们所看到的网页内容了：

HTTP的原理和工作机制_表单_06

其中发送请求与响应其实是有一定的数据格式的，如下：

HTTP的原理和工作机制_客户端_07

URL -> HTTP报文：

其中对于我们在浏览器中敲的网页地址最终都会对应成HTTP的报文，先来了解一下：

HTTP的原理和工作机制_服务器_08

对于用户而言就是一个地址，但是其被定义成了：

HTTP的原理和工作机制_客户端_09

而其实发送时的报文格式会变成：

HTTP的原理和工作机制_服务器_10

那，这里有一个小疑问：

HTTP的原理和工作机制_表单_11

这里先放一放，待了解之后的工作方式可以再回过头来理解它。

请求报文格式：

对于咱们写的请求接口的代码其整个过程会是如下：

HTTP的原理和工作机制_客户端_12

其实对于具体请求响应细节就看不到了，对于请求报文而言其实是长这样子的：

HTTP的原理和工作机制_表单_13

注意：GET时是没有Body的，上图只是画了一个整体的格式，并不严谨，所以这就是为啥上面请求报文不能这样写的原因了：

HTTP的原理和工作机制_客户端_14

这样写是不符合请求报文规定的格式的。

响应报文格式：

跟请求报文格式比较相似，如下：

HTTP的原理和工作机制_服务器_15

其中status message服务开发人员是可以改的，对返回状态的简要描述。

Request method：

GET: 获得资源，木有Body：【具有幂等性】

HTTP的原理和工作机制_表单_16

对应 Retrofit 的代码【我们的观注点在Android，所以在了解了HTTP协议相关的东东时需要联系到怎么使用】:

HTTP的原理和工作机制_服务器_17

POST:增加或修改资源，有Body：【不具有幂等性】

HTTP的原理和工作机制_客户端_18

对应 Retrofit 的代码:

HTTP的原理和工作机制_客户端_19

PUT: 修改资源，有Body：【具有幂等性，用得较少】

HTTP的原理和工作机制_服务器_20

对应 Retrofit 的代码:

HTTP的原理和工作机制_表单_21

其中GET和PUT都是幂等的，啥叫幂等？

HTTP的原理和工作机制_客户端_22

也就是我GET多次或者PUT多次是不会影响服务器的结果的，但是POST就不是幂等的，也就是用POST增加一个用户，执行多次则会在服务器中插入多条数据，也就是执行多次是会影响到结果的。

DELETE: 删除资源，没有Body：【具有幂等性】

HTTP的原理和工作机制_服务器_23

对应Retrofit代码：

HTTP的原理和工作机制_客户端_24

HEAD：跟GET几乎是一样的，区别就是这种请求服务器是不会返回Body内容的，在做下载时可能想先知道文件有多大，支不支持断点续传之类的，用它就比较合适，先用HEAD一下获取相关的信息之后，然后再发起真正的下载请求。

Response status code：

作用：对结果做出类型化描述（如【获取成功】、【内容未找到】）

1xx：临时性消息。如:100 (继续发送)、101(正在切换协议)
一般是100、101，一般都是信息性的东东，比如HTTP1.x和HTTP2.x是不兼容的，在请求时可以循问服务器是否支持HTTP2.x这个协议，然后就会下发101状态码给客户端，如果下发的是200状态码则证明该服务肯定是不支持HTTP2.X协议，所以客户端就可以针对性的进行协议转换。
2xx：成功。最典型的是 200(OK)、201(创建成功)。
典型的200，当然除了200，还有其它2开头的，反正一点就是它代表成功的意思。
3xx：重定向。如 301(永久移动)、302(暂时移动)、304(内容未改变)。
典型的就是301，如对于一个https的地址输入http，就会有它，如下：

HTTP的原理和工作机制_服务器_26

HTTP的原理和工作机制_服务器_27

这是永久性牵移，另外还有一个302临时性牵移，一般都是用永久性301，这些重定向对于搜索引擎是有用的。

另一个典型就是304，代表着网页内容木有改变，也就是不用再次做页面刷新，比如我们还是对刚才这个网页刷一下，看状态码：

HTTP的原理和工作机制_客户端_28

4xx：客户端错误。如 400(客户端请求错误)、401(认证失败)、403(被禁⽌止)、404(找不不到内容)。

客户端是指手机软件、浏览器等，如400【参数错误】、404【页面找不到】、401【未登录去请求登录资源时】。5xx：服务器错误。

典型的500。

Header：

作用：http消息的元数据（metadata）

Host：服务器主机地址。
如：

但是需要注意的是该地址不是用来进行寻址的，其寻址是在发该请求报文之前通过DNS进行的，那既然这个地址不是用来寻址，那为啥还要发一下这个域名呢？因为一个IP地址有多个虚拟服务器主机存在，也就是对外的IP是同一个，那用户假如要访问其中的一个虚拟服务器则就需要带这个Host，没有它那服务器就蒙了，到底要找它里面的哪台虚拟主机。

Content-Type/Content-Length：Body的类型 / 长度。

Content-Length：内容的长度（字节），那为啥要有它呢？因为可以发二进制内容，以至于要想知道该二进制内容啥时候结束用任何一种结束符都不管用，因为二进制中包含任何特殊字符的可能，所以如果不指定总长度的话，那就无法读全二进制。

Content-Type【重点】：内容的类型：

①、text/html：html文本，用于浏览器页面响应。

HTTP的原理和工作机制_表单_30

那为啥还得指定这个类型呢？因为有可能返回JSON信息，如下面这个页面：

HTTP的原理和工作机制_客户端_31

②、application/x-www-form-urlencoded：普通表单，encoded URL格式。

HTTP的原理和工作机制_表单_32

做过web开发的人肯定知道啥叫普通表单，瞅一下：

HTTP的原理和工作机制_服务器_33

HTTP的原理和工作机制_客户端_34

然后咱们提交一下：

HTTP的原理和工作机制_服务器_35

HTTP的原理和工作机制_服务器_36

然后此时瞅一下请求头信息：

HTTP的原理和工作机制_客户端_37

也就是告诉服务器此次提交的是表单信息，然后服务器就会按如下格式读取表单数据：

HTTP的原理和工作机制_客户端_38

　　如果在Android中想要模拟表单提交，也得按这种格式去弄，但是好在有retrofit框架，使用起来大大简化了，如：

HTTP的原理和工作机制_客户端_39

③、multipart/form-data：多部分形式，一般用于传输包含二进制内容的多项内容。

其实这种形式就是带文件的表单，不是纯文本了，如：

HTTP的原理和工作机制_表单_40

HTTP的原理和工作机制_表单_41

然后咱们上传一下：

HTTP的原理和工作机制_服务器_42

HTTP的原理和工作机制_服务器_43

HTTP的原理和工作机制_服务器_44

　　其中上传的格式如下：

HTTP的原理和工作机制_表单_45

其中表单数据是以boundary进行分界的，其中注意一个细节：

HTTP的原理和工作机制_表单_46

HTTP的原理和工作机制_表单_47

其实对于纯文本的表单也可以用这种形式上传，但是！！！很浪费空间，浪费空间就是浪费带宽，所以实际没这样做的，这种只适合于表单中有文件上传的表单。而在Android的retrofit可以这样来模拟：
HTTP的原理和工作机制_服务器_48
④、application/json：json形式，用于Web Api的响应或POST / PUT 请求。

HTTP的原理和工作机制_服务器_50

像Android的API大部分都是用的这种。对应的Retrofit的代码：

HTTP的原理和工作机制_表单_51

⑤、image/jpeg / application/zip ...：单文件，用于Web Api响应或POST / PUT 请求。

HTTP的原理和工作机制_表单_52

如果只有一个文件上传就可以采用这种方式，最高效，不需要boundary，但是！！实际用的比较少。。因为网页开发时基本没有这种方式，都需要提交表单的，所以大部分不知道这种提交方式，所以都不会的话那API也不可能设计成这种呗，所以，前端也就使用不到啦，其实这种方式retrofit是完全支持的，如下：

HTTP的原理和工作机制_表单_53

Location：重定向的目标URL。

还是回到之前原来是https的链接，我们故意敲http，此时就会引发重定向，重定向到哪就是由这个头信息来决定的，如下：

HTTP的原理和工作机制_客户端_54

HTTP的原理和工作机制_客户端_55

User-Agent：用户代理。即是谁实际发送请求、接受响应的，例如手机浏览器、某款⼿机 App。

如：

HTTP的原理和工作机制_客户端_56

Range / Accept-Range ：指定Body的内容范围。【断点续传、多线程下载的核心技术点】

HTTP的原理和工作机制_客户端_57

咱们演示一下效果，先在百度地图中搜索一张图片：

HTTP的原理和工作机制_客户端_58

然后将其地址粘贴一下，然后此时需要下载一个工具来进行演示，叫Postman，如下：

HTTP的原理和工作机制_表单_59

然后安装之后打开将该图片的地址粘贴到Postman里面：

HTTP的原理和工作机制_表单_60

HTTP的原理和工作机制_客户端_61

HTTP的原理和工作机制_客户端_62

然后咱们看一下服务器是否支持分段加载，看一下头信息就知道了：

HTTP的原理和工作机制_客户端_63

支持，然后看一下总大小：

HTTP的原理和工作机制_客户端_64

然后咱们尝试只加载图片的一半，也就是从0~6902，所以咱们来试一下：

HTTP的原理和工作机制_服务器_65

Cookie / Set-Cookie：发送 Cookie / 设置 Cookie。【之后学习中会详说】Authorization：授权信息。Accept：客户端能接受的数据类型。如text/html。Accept-Charset：客户端接受的字符集。如utf-8Accept-Encoding：客户端接受的压缩编码类型。如gzip。【之后学习中也会详说】 Content-Encoding：压缩类型。如gzip。

Chuncked Transfer Encoding：分块传输编码

HTTP的原理和工作机制_服务器_66