Linux 第75天 http概念

时间: 20181017


目录

术语翻译

基本html组成组件

MEMI Multipurpose Internet Mail Extensions

HTTP工作机制

如何提高HTTP连接性能

URI: Uniform Resource Identifier

网站访问量

一次完整的http请求处理过程

建立连接-发送请求-处理请求-访问资源-构建响应报文-发送响应报文-记录日志

MPM工作模式

httpd命令



术语翻译

http: Hyper Text Transfer Protocol, 80/tcp

html: Hyper Text Markup Language


基本html组成组件

<html>

<head>

<title> </title>

</head>

<body>

</body>

</html>



css: Cascading Style Sheet 设置页面样式

js: javascript 设置客户端脚本


MEMI Multipurpose Internet Mail Extensions

一种方式可以使http协议来传输二进制文件


格式:major/minor

text/plain

text/html

text/css

image/jpeg

image/png

video/mp4

application/javascript



HTTP工作机制

http请求:http request

http响应:http response

一次http事务:请求<-->响应

Web资源:web resource

一个网页由多个资源构成,打开一个页面,会有多个资源展示出来,

但是每个资源都要单独请求。因此,一个“Web 页面”通常并不是单

个资源,而是一组资源的集合

静态文件:无需服务端做出额外处理

文件后缀:.html, .txt, .jpg, .js, .css, .mp3, .avi

动态文件:服务端执行程序,返回执行的结果

文件后缀:.php, .jsp ,.asp


提高HTTP连接性能

并行连接:通过多条TCP连接发起并发的HTTP请求

持久连接:keep-alive,长连接,重用TCP连接,以消除连接和关闭的时延,以事

务个数和时间来决定是否关闭连接

管道化连接:通过共享TCP连接发起并发的HTTP请求

复用的连接:交替传送请求和响应报文(实验阶段)




html method

GET,POST,PUT,HEAD,PATCH,OPTIONS,DELETE,TRACE


URI: Uniform Resource Identifier

URN: Uniform Resource Naming

URL: Uniform Resource Locator


URL组成

<scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>

scheme:方案,访问服务器以获取资源时要使用哪种协议

user:用户,某些方案访问资源时需要的用户名

password:密码,用户对应的密码,中间用:分隔

Host:主机,资源宿主服务器的主机名或IP地址

port:端口,资源宿主服务器正在监听的端口号,很多方案有默认端口号

path:路径,服务器资源的本地名,由一个/将其与前面的URL组件分隔

params:参数,指定输入的参数,参数为名/值对,多个参数,用;分隔

query:查询,传递参数给程序,如数据库,用?分隔,多个查询用&分隔

frag:片段,一小片或一部分资源的名字,此组件在客户端使用,用#分隔


网站访问量

IP(独立IP):即Internet Protocol,指独立IP数。一天内来自相同客户机IP

地址只计算一次,记录远程客户机IP地址的计算机访问网站的次数,是

衡量网站流量的重要指标

PV(访问量): 即Page View, 页面浏览量或点击量,用户每次刷新即被

计算一次,PV反映的是浏览某网站的页面数,PV与来访者的数量成正

比,PV并不是页面的来访者数量,而是网站被访问的页面数量

UV(独立访客):即Unique Visitor,访问网站的一台电脑为一个访客。一

天内相同的客户端只被计算一次。可以理解成访问某网站的电脑的数量

。网站判断来访电脑的身份是通过来访电脑的cookies实现的。如果更换

了IP后但不清除cookies,再访问相同网站,该网站的统计中UV数是不

变的


QPS:request per second,每秒请求数

PV,QPS,并发连接数换算公式

QPS= PV* 页⾯衍⽣连接次数/ 统计时间(86400)

并发连接数 =QPS * http平均响应时间

峰值时间:每天80%的访问集中在20%的时间里,这20%时间为峰值时间

峰值时间每秒请求数(QPS)=( 总PV数 *页⾯衍⽣连接次数)*80% ) / (每天秒数 * 20% )



一次完整的http请求处理过程

建立连接->接收请求->处理请求->访问资源->构建响应报文->发送响应报文->记录日志


1、建立连接:接收或拒绝连接请求

2、接收请求:接收客户端请求报文中对某资源的一次请求的过程

Web访问响应模型(Web I/O)

单进程I/O模型:启动一个进程处理用户请求,而且一次只处理一个,多个请求被串行响应

多进程I/O模型:并行启动多个进程,每个进程响应一个连接请求

复用I/O结构:启动一个进程,同时响应N个连接请求

实现方法:多线程模型和事件驱动

多线程模型:一个进程生成N个线程,每线程响应一个连接请求

事件驱动:一个进程处理N个请求

复用的多进程I/O模型:启动M个进程,每个进程响应N个连接请求,同时接收M*N个请求


3、处理请求:服务器对请求报文进行解析,并获取请求的资源及请求

方法等相关信息,根据方法,资源,首部和可选的主体部分对请求进行处理

元数据:请求报文首部

<method> <URL> <VERSION>

HEADERS 格式 name:value

<request body>

示例:

Host: www.winthcloud.com 请求的主机名称

Server: Apache/2.4.7

HTTP常用请求方式,Method

GET、POST、HEAD、PUT、DELETE、TRACE、OPTIONS


4、访问资源:

服务器获取请求报文中请求的资源web服务器,即存放了web资源的服务器,负责向

请求者提供对方请求的静态资源,或动态运行后生成的资源

资源放置于本地文件系统特定的路径:DocRoot

DocRoot /var/www/html

/var/www/html/images/logo.jpg

http://www.winthcloud.com/images/logo.jpg

web服务器资源路径映射方式:

(a) docroot

(b) alias

(c) 虚拟主机docroot

(d) 用户家目录docroot


5、构建响应报文:

一旦Web服务器识别了资源,就执行请求方法中描述的动作,并返回响应报文。

响应报文中 包含有响应状态码、响应首部,如果生成了响应主体的话,还包括响应主体

1)响应实体:如果事务处理产生了响应主体,就将内容放在响应报文中回送过

去。响应报文中通常包括:

描述了响应主体MIME类型的Content-Type首部

描述了响应主体长度的Content-Length

实际报文的主体内容

2)URL重定向:web服务构建的响应并非客户端请求的资源,而是资源另外一个访问路径

永久重定向:http://www.360buy.com

临时重定向:http://www.taobao.com

3)MIME类型:

Web服务器要负责确定响应主体的MIME类型。多种配置服务器的方

法可将MIME类型与资源管理起来

魔法分类:Apache web服务器可以扫描每个资源的内容,并将其与一

个已知模式表(被称为魔法文件)进行匹配,以决定每个文件的MIME类型

。这样做可能比较慢,但很方便,尤其是文件没有标准扩展名时

显式分类:可以对Web服务器进行配置,使其不考虑文件的扩展名或

内容,强制特定文件或目录内容拥有某个MIME类型

类型协商: 有些Web服务器经过配置,可以以多种文档格式来存储资

源。在这种情况下,可以配置Web服务器,使其可以通过与用户的协商

来决定使用哪种格式(及相关的MIME类型)"最好"

6、发送响应报文

Web服务器通过连接发送数据时也会面临与接收数据一样的问题。服务

器可能有很多条到各个客户端的连接,有些是空闲的,有些在向服务器

发送数据,还有一些在向客户端回送响应数据。服务器要记录连接的状

态,还要特别注意对持久连接的处理。对非持久连接而言,服务器应该

在发送了整条报文之后,关闭自己这一端的连接。对持久连接来说,连

接可能仍保持打开状态,在这种情况下,服务器要正确地计算Content-

Length首部,不然客户端就无法知道响应什么时候结束了

7、记录日志

最后,当事务结束时,Web服务器会在日志文件中添加一个条目,来描

述已执行的事务


http特性

高度模块化

DSO: Dynamic Shared Object

MPM: multi-processing module 多路处理模块


MPM工作模式

prefork:多进程I/O模型,每个进程响应一个请求,默认模型

一个主进程:生成和回收n个子进程,创建套接字,不响应请求

多个子进程:工作work进程,每个子进程处理一个请求;系统初始时,预

先生成多个空闲进程,等待请求,最大不超过1024个

worker:复用的多进程I/O模型,多进程多线程,IIS使用此模型

一个主进程:生成m个子进程,每个子进程负责生个n个线程,每个线程响

应一个请求,并发响应请求:m*n

event:事件驱动模型(worker模型的变种)

一个主进程:生成m个子进程,每个进程直接响应n个请求,并发响应请求:m*n,

有专门的线程来管理这些keep-alive类型的线程,当有真实请求时将请求传递给

服务线程,执行完毕后,又允许释放。这样增强了高并发场景下的请求处理能力

httpd-2.2: event 测试版,centos6默认

httpd-2.4:event 稳定版,centos7默认


httpd功能特性

虚拟主机 ip,port,FQDN

CGI: Common Gateway Interface

反向代理

负载均衡

路径别名

丰富的用户认证机制

basic

digest

支持第三方模块


httpd命令

httpd 

-M 查看所加载的模块

-t 检测语法错误

-l 列出编译的模块

-L 显示可以使用的参数


htpasswd命令用来生成账号密码

-c 创建账号密码文件

-b 在命令行直接指定命令

-m 使用md5加密密码