在LInux服务器上实现web服务,常见无非也就是Apache、Nginx、Tomcat。

三者之间的区别:

  • Apache:支持的模块比较多,采用servlet处理模型,同步阻塞模型,工作模式多变,对于高并发的场景处理速度比较慢,运行稳定;
  • Nginx :轻量级web服务器,自身支持模块少,需要借助第三方模块支持(Nginx官网就可以下载),采用epoll处理模式,异步非阻塞型,适合高并发场景,配置简单;
  • Tomcat:apache软件基金会下开源的子项目,也成为容器,主要处理java语言编写的页面,也可以处理html页面,并发连接小;

今天这篇博文主要就是围绕apache-2.4.23版本展开的:

对apache不太了解的朋友可以参考博文:基于Apache搭建Web服务器详解
这里就不具体介绍apache究竟是什么、它的起因什么的了。

博文大纲:
一、httpd-2.4.23版本特性
二、编译安装httpd-2.4.23
三、apche的三种工作模式
四、进程与线程的区别

一、httpd-2.4.23版本特性

新版本的httpd-2.4.23新增模块:

  • mod_proxy_fcgi(可提供fcgi代理);
  • mod_ratelimit(限制用户带宽);
  • mod_request(请求模块,对请求进行过滤);
  • mod_remoteip(匹配客户端的IP地址);

对于基于IP的访问控制进行了修改,不再支持allow、deny、order机制,而是统一使用require进行!

新增的特性有:

  • MPM支持在运行时装载;
  • 支持envet工作模式;
  • 支持异步读写功能;
  • 每个模块都可以指定输出的日志级别;
  • 增强版的表达式分析器;
  • 请求配置:<if>,<elseif>;
  • 毫秒级别的keepalive timeout;
  • 支持FQDN的虚拟主机;
  • 支持自定义变量;

接下来开始安装!

二、编译安装httpd-2.4.23

安装环境:

(1)首先检查是否安装httpd软件包

[root@localhost ~]# rpm -q httpd
未安装软件包 httpd 
//如果存在,使用“-e”选项进行卸载

(2)安装apr

apr是Apache可移植运行库,是一个对操作系统条用的抽象库,用于实现Apache内部组件对操作系统的使用,提高系统的可移植性。

[root@localhost ~]# tar zxf apr-1.5.2.tar.gz -C /usr/src
[root@localhost ~]# cd /usr/src/apr-1.5.2/
[root@localhost apr-1.5.2]# ./configure --prefix=/usr/local/apr && make && make install

(3)安装apr-util

 [root@localhost ~]# tar zxf apr-util-1.5.4.tar.gz -C /usr/src
 [root@localhost ~]# cd /usr/src/apr-util-1.5.4/
 [root@localhost apr-util-1.5.4]#  ./configure --prefix=/usr/local/apr-util --with-apr=/usr/local/apr && make && make install

(4)安装zlib

[root@localhost ~]# tar zxf zlib-1.2.8.tar.gz -C /usr/src
[root@localhost ~]# cd /usr/src/zlib-1.2.8/
[root@localhost zlib-1.2.8]#  ./configure --prefix=/usr/local/zlib && make && make install

(5)安装pcre

[root@localhost ~]# tar zxf pcre-8.39.tar.gz -C /usr/src
[root@localhost ~]# cd /usr/src/pcre-8.39/
[root@localhost pcre-8.39]#  ./configure -- prefix=/usr/local/pcre && make && make install

(6)安装openssl

安装apache-2.4.23版本时,会提示openssl自带的版本过低,需要自行手动安装新的版本。

[root@localhost ~]# tar zxf openssl-1.0.1u.tar.gz -C /usr/src
[root@localhost ~]# cd /usr/src/openssl-1.0.1u/
[root@localhost openssl-1.0.1u]#  ./config -fPIC --prefix=/usr/local/openssl enable-shared && make && make install
//PIC使.so文件的代码段变为真正意义上的共享
//如果不加-fPIC,则加载.so文件的代码段时,代码段引用的数据对象需要重定位, 重定位会修改代码段的内容,这就造成每个使用这个.so文件代码段的进程在内核里都会生成这个.so文件代码段的copy.每个copy都不一样,取决于 这个.so文件代码段和数据段内存映射的位置.

(7)安装 httpd-2.4.23

[root@localhost ~]# tar zxf httpd-2.4.23.tar.gz -C /usr/src
[root@localhost ~]# cd /usr/src/httpd-2.4.23/
[root@localhost httpd-2.4.23]#  ./configure --prefix=/usr/local/http-2.4.23 --enable-so --enable-cgi \
 --enable-cgid --enable-ssl --with-ssl=/usr/local/openssl --enable-rewrite \
 --with-pcre=/usr/local/pcre --with-z=/usr/local/zlib --with-apr=/usr/local/apr \
 --with-apr-util=/usr/local/apr-util --enable-modules=most --enable-mods-shared=most \
 --enable-mpms-shared=all --with-mpm=event --enable-proxy --enable-proxy-fcgi --enable-expires \
 --enable-deflate  && make && make install

各选项含义:

  • --enable-so:支持动态共享模块;
  • --enable-rewrite:支持url重写;
  • --enable-ssl:支持ssl;
  • --with-ssl=/usr/local/openssl:指定ssl安装位置;
  • --enable-cgi:开启cgi通用网管接口;
  • --enable-cgid:开启cig通用网管接口管理程序;
  • --enable-modules=most:编译成二进制是安装常用模块;
  • --enable-mpms-shared=all:安装apache的所有工作模式;
  • --with-mpm=event:指定默认的运行方式
  • --with-pcre=/usr/local/pcre:支持 pcre ;
  • --with-z=/usr/local/zlib:使用 zlib 压缩库;
  • --with-apr=/usr/local/apr:指定 apr 的安装路径;
  • --with-apr-util=/usr/local/apr-util:指定 apr-util 的安装路径;
  • --enable-expires:支持缓存;
  • --enable-deflate:支持压缩;

(8)优化http程序的执行路径

[root@localhost httpd-2.4.23]#  ln -s /usr/local/http-2.4.23/bin/* /usr/local/bin/ 

(9)添加为系统服务

[root@localhost httpd-2.4.23]#  cp /usr/local/http-2.4.23/bin/apachectl /etc/init.d/httpd 
[root@localhost httpd-2.4.23]# vim /etc/init.d/httpd
#!/bin/bash                      //修改
#chkconfig: 35 85 15                   //添加
…………                  //省略以下内容
[root@localhost httpd-2.4.23]#  chkconfig --add httpd 
[root@localhost httpd-2.4.23]# systemctl start httpd
[root@localhost httpd-2.4.23]# netstat -anpt | grep 80
tcp6       0      0 :::80                   :::*                    LISTEN      108903/httpd 
[root@localhost ~]# httpd -M              //可以查看到httpd服务启动加载的模块
AH00558: httpd: Could not reliably determine the server's fully qualified domain name, using localhost.localdomain. Set the 'ServerName' directive globally to suppress this message
//关于启动服务时提示以上的信息,可以省略,也可修改其配置文件(/usr/local/http-2.4.23/conf/httpd.conf)文件找到“ServerName ”一行,根据实际情况进行修改
Loaded Modules:
 core_module (static)
 so_module (static)
 http_module (static)
 authn_file_module (shared)
 authn_core_module (shared)
 authz_host_module (shared)
 authz_groupfile_module (shared)
 authz_user_module (shared)
 authz_core_module (shared)
 access_compat_module (shared)
 auth_basic_module (shared)
 reqtimeout_module (shared)
 filter_module (shared)
 mime_module (shared)
 log_config_module (shared)
 env_module (shared)
 headers_module (shared)
 setenvif_module (shared)
 version_module (shared)
 mpm_prefork_module (shared)
 unixd_module (shared)
 status_module (shared)
 autoindex_module (shared)
 dir_module (shared)
 alias_module (shared)

至此apache-2.4.23已经安装完成。

三、apche的三种工作模式

(1)Prefork模式

其工作方式:当Apache服务启动后,mpm_prefork模块会预先创建多个子进程(默认为5个),每个子进程只有一个线程,当接收到客户端请求后,mpm_prefork模块再将请求转交给子进程进行处理,并且每个子进程同时只能用于单个请求。如果当前的请求数将超过预先创建的子进程数时,mpm_prefork模块就会创建新的子进程来处理额外的请求。
如图:
Apache的安装部署及工作模式详解
Apache总是试图保持一些备用或空闲的子进程用于迎接即将到来的请求。这样客户端的请求就不需要在接收后等待子进程的产生。

由于在 mpm_prefork 模块中,每个请求对应一个子进程,因此其占用的系统资源相对其他 两种模块而言较多。不过 mpm_prefork 模块的优点在于它的每个子进程都会独立处理对应 的单个请求,这样,如果其中一个请求出现问题就不会影响到其他请求。Prefork 在效率上 要比 Worker 要高,但是内存使用大得多不擅长处理高并发的场景。

开启prefork模式的方法:

[root@localhost ~]# vim /usr/local/http-2.4.23/conf/httpd.conf
//编写httpd的主配置文件,修改一下内容
Include conf/extra/httpd-mpm.conf                     //默认存在删除“#”号即可
#LoadModule mpm_event_module modules/mod_mpm_event.so
//添加#号
LoadModule mpm_prefork_module modules/mod_mpm_prefork.so
//默认存在,删除#号即可!
#LoadModule mpm_worker_module modules/mod_mpm_worker.so
//这三行便是apache的三种工作模式,可根据实际情况进行切换
[root@localhost ~]# systemctl restart httpd      //重新启动httpd服务
[root@localhost ~]# systemctl start httpd     //手动再启动一下
[root@localhost ~]# httpd -V      //查看httpd的工作模式
//找到这一行即可
Server MPM:     prefork                //可以看到现在Apache工作在prefork模式

与prefork模式有关的配置文件如下:

[root@localhost ~]# vim /usr/local/http-2.4.23/conf/extra/httpd-mpm.conf 
//设置prefork模式也就只有这几个参数,具体含义:
<IfModule mpm_prefork_module>            //这就是prefork工作模式的参数-
    StartServers             5                //apache启动时默认开启的子进程数
    MinSpareServers          5                  //最小的闲置子进程数
    MaxSpareServers         10               //最大的闲置子进程数
    MaxRequestWorkers      250        // 设置了允许同时的最大接入请求数量
    MaxConnectionsPerChild   0         //0表示每个子进程处理完数据后进程永不销毁,设置成非0时,可防止内存泄漏,服务器在负载小时自动减少自己进程数
</IfModule>

关于其配置内容可参考图片:
Apache的安装部署及工作模式详解
//注 1:MaxRequestWorkers 是这些指令中最为重要的一个,设定的是 Apache 可以同时处理 的请求,是对 Apache 性能影响最大的参数。如果请求总数已达到这个值(可通过 ps -ef|grep http|wc -l 来确认),那么后面的请求就要排队,直到某个已处理请求完毕。这就是系统资源 还剩下很多而 HTTP 访问却很慢的主要原因。虽然理论上这个值越大,可以处理的请求就越 多,建议将初始值设为(以 Mb 为单位的最大物理内存/2),然后根据负载情况进行动态调整。 比如一台 4G 内存的机器,那么初始值就是 4000/2=2000
注 2:prefork 控制进程在最初建立“StartServers”个子进程后,为了满足 MinSpareServers 设置的需要创建一个进程,等待一秒钟,继续创建两个,再等待一秒钟,继续创建四个……如 此按指数级增加创建的进程数,最多达到每秒 32 个,直到满足 MinSpareServers 设置的值为止。这种模式 可以不必在请求到来时再产生新的进程,从而减小了系统开销以增加性能。 MaxSpareServers 设置了最大的空闲进程数,如果空闲进程数大于这个 值,Apache 会自动 kill 掉一些多余进程。这个值不要设得过大,但如果设的值比 MinSpareServers 小,Apache 会自 动把其调整为 MinSpareServers+1。如果站点负载较大,可考虑同时加大 MinSpareServers 和 MaxSpareServers。
注 3:ServerLimit 和 MaxClients(MaxRequestWorkers)有什么区别呢? 是因为在 apache1 时代,控制最大进程数只有 MaxClients 这个参数,并且这个参数最大值为 256,并且是写死了的,试图设置为超过 256 是无效的,这是由于 apache1 时代的服务器硬 件限制的。但是 apache2 时代由于服务器硬件的升级,硬件已经不再是限制,所以使用 ServerLimit 这个参数来控制最大进程数,ServerLimit 值>=MaxClient 值才有效。ServerLimit 要放在 MaxClients 之前,值要不小于 MaxClients

优点:成熟,兼容所有新老模块。进程之间完全独立,使得它非常稳定。同时,不需要担心线程安全的问题。(我们常用的mod_php,PHP的拓展不需要支持线程安全)

缺点:一个进程相对占用更多的系统资源,消耗更多的内存。而且,它并不擅长处理高并发请求,在这种场景下,它会将请求放进队列中,一直等到有可用进程,请求才会被处理。

(2)Worker工作模式

Worker 模式(多线程多进程): 和 prefork 模式相比,worker 使用了多进程和多线程的混合模式,worker 模式也同样会先预派生一些子进程,然后每个子进程创建一些线程,同时包括一个监听线程,每个请求过来会 被分配到一个线程来服务。线程比起进程会更轻量,因为线程是通过共享父进程的内存空间, 因此,内存的占用会减少一些,在高并发的场景下会比 prefork 有更多可用的线程,表现会 更优秀一些;另外,如果一个线程出现了问题也会导致同一进程下的线程出现问题,如果是 多个线程出现问题,也只是影响 Apache 的一部分,而不是全部。由于用到多进程多线程, 需要考虑到线程的安全了,在使用 keep-alive 长连接的时候,某个线程会一直被占用,即使 中间没有请求,需要等待到超时才会被释放(该问题在 prefork 模式下也存在) 总的来说,prefork 方式速度要稍高于 worker,然而它需要的 cpu 和 memory 资源也稍多于 woker。如图:
Apache的安装部署及工作模式详解

Apache总是试图维持一个备用(spare)或是空闲的服务线程池。这样,客户端无须等待新线程或新进程的建立即可得到处理。在Unix中,为了能够绑定80端口,父进程一般都是以root身份启动,随后,Apache以较低权限的用户建立子进程和线程。User和Group指令用于配置Apache子进程的权限。虽然子进程必须对其提供的内容拥有读权限,但应该尽可能给予他较少的特权。另外,除非使用了suexec(负责处理CGI和SSI程序的请求,确保网页使用者能以该目录或程序的用户ID来执行远程程序。) ,否则,这些指令配置的权限将被CGI脚本所继承。

线程比起进程会更轻量,因为线程通常会共享父进程的内存空间,因此,内存的占用会减少一些,在高并发的场景下,表现得比 prefork模式好。

有些人会觉得奇怪,那么这里为什么不直接使用多线程呢?主要是需要考虑稳定性,如果一个线程异常挂了,会导致父进程连同其他正常的子线程都挂了(它们都是同一个进程下的)。多进程+多线程模式中,各个进程之间都是独立的,如果某个线程出现异常,受影响的只是Apache的一部分服务,而不是整个服务。其他进程仍然可以工作。

有关work模式的配置:

//自行修改httpd主配置文件,切换模式并重启服务,接下来
[root@localhost ~]# vim /usr/local/http-2.4.23/conf/extra/httpd-mpm.conf 
<IfModule mpm_worker_module>       //这是worker工作模式的参数
    StartServers             3                  //apache启动时默认开始的子进程数
    MinSpareThreads         75            //最小空闲数量的工作线程-
    MaxSpareThreads        250          //最大空闲数量的工作线程-
    ThreadsPerChild         25              //每个子进程产生的线程数量
    MaxRequestWorkers      400        //每个进程最大接受的请求数量
    MaxConnectionsPerChild   0         //表示永不销毁
</IfModule>

有关work模式的详细介绍请参考图片:
Apache的安装部署及工作模式详解
Worker模式下所能同时处理的请求总数是由子进程总数乘以ThreadsPerChild 值决定的,应该大于等于MaxRequestWorkers。如果负载很大,现有的子进程数不能满足时,控制进程会派生新的子进程。默认最大的子进程总数是16,加大时 也需要显式声明ServerLimit(最大值是20000)。需要注意的是,如果显式声明了ServerLimit,那么它乘以 ThreadsPerChild的值必须大于等于MaxRequestWorkers,而且MaxRequestWorkers必须是ThreadsPerChild的整数倍,否则 Apache将会自动调节到一个相应值。

优点:占据更少的内存,高并发下表现更优秀。

缺点:必须考虑线程安全的问题,因为多个子线程是共享父进程的内存地址的。如果使用keep-alive的长连接方式,也许中间几乎没有请求,这时就会发生阻塞,线程被挂起,需要一直等待到超时才会被释放。如果过多的线程,被这样占据,也会导致在高并发场景下的无服务线程可用。(该问题在prefork模式下,同样会发生)。

(3)Event MPM

这是Apache最新的工作模式,它和worker模式很像,不同的是在于它解决了keep-alive长连接的时候占用线程资源被浪费的问题,在event工作模式中,会有一些专门的线程用来管理这些keep-alive类型的线程,当有真实请求过来的时候,将请求传递给服务器的线程,执行完毕后,又允许它释放。这增强了在高并发场景下的请求处理。如图:
Apache的安装部署及工作模式详解

有关Event MPM模式的配置:

//自行修改httpd主配置文件,切换模式并重启服务,接下来
[root@localhost ~]# vim /usr/local/http-2.4.23/conf/extra/httpd-mpm.conf 
<IfModule mpm_event_module>
    StartServers             3
    MinSpareThreads         75
    MaxSpareThreads        250
    ThreadsPerChild         25
    MaxRequestWorkers      400
    MaxConnectionsPerChild   0                 
</IfModule>
//其各项配置内容与work模式十分相似,这里就不多说了!

四、进程与线程的区别

线程就是指进程内的一个执行单元,也是进程内的可调度实体。

线程与进程的区别:

  • 地址空间:进程内的一个执行单元;进程至少有一个线程;它们共享进程的地址空间;而进程有自己独立的地址空间;
  • 资源拥有:进程是资源分配和拥有的单位,同一个进程内的线程共享进程的资源;
  • 线程是处理器调度的基本单位,但进程不是;
  • 二者均可并发执行;

进程和线程都是由操作系统所体会的程序运行的基本单元,系统利用该基本单元实现系统对应用的并发性。
进程和线程的区别在于:
简而言之,一个程序至少有一个进程,一个进程至少有一个线程。
线程的划分尺度小于进程,使得多线程程序的并发性高。
另外,进程在执行过程中拥有独立的内存单元,而多个线程共享内存,从而极大地提高了程
序的运行效率。

———————— 本文至此结束,感谢阅读 ————————