一、Apache简介


  • Apache是世界上应用最广泛的Web服务器之一,尤其是现在,使用LAMP(Linux+Apache+MySQL+PHP)来搭建Web应用已经是一种流行的方式,因此,掌握Apache的配置是系统工程师必备的技能之一。
  • "Apache HTTP Server"开源软件项目杰出代表,使用标准HTTP网络协议提供网页浏览服务,可运行在多种操作系统平台中;使用标准B/S架构
  • Apache是针对之前出现的若干个Web服务器程序进行整合、完善后形成的软件,其名源于"A Patchy Server",意为“基于原有Web服务程序的代码进行修改(补丁)后形成的服务器程序"
  • 1995发布1.0版本,后有"Apache Group"负责该项目的管理和维护;1999年在"Apache Group"基础成立Apache软件基金会(Apache Software Foundation,ASF)
  • 为ASF旗下著名软件项目之一,正式名称为"httpd"

二、Apache特点


  • 开放源代码:任何人都可自由使用,充分体现开源软件精神
  • 跨平台应用:可运行在绝大多数软硬件平台,这得益于Apache的源代码开放
  • 支持各种Web编程语言:可支持Perl、PHP、Python、Java、ASP等
  • 模块化设计:将Apache功能分为各种模块,需要什么功能直接加载对应模块;并且支持商业自行开发模块
  • 运行稳定:可用于构建具有大负载访问量的Web站点
  • 良好的安全性:维护团队及时对已发现漏洞提供修补程序

三、Apache版本


  • 1.X:最高1.3,该版本继承Apache服务器1.0版本以来的优秀特性和配置管理风格,具有良好兼容、稳定性;目前已停止维护
    
  • 2.X:Apache加入许多新的功能,新的配置语法和管理风格
    

四、httpd错误代码


  • 100(继续) - 请求者应当继续提出请求。服务器返回此代码表示已收到请求的第一部分,正在等待其余部分
  • 101(切换协议) - 请求者已要求服务器切换协议,服务器已确认并准备切换
    
  • 200(成功) - 服务器已成功处理了请求。通常,这表示服务器提供了请求的网页。如果是对您的 robots.txt 文件显示此状态码,则表示 Googlebot 已成功检索到该文件
    
  • 201(已创建) - 请求成功并且服务器创建了新的资源
    
  • 202(已接受) - 服务器已接受请求,但尚未处理
    
  • 203(非授权信息) - 服务器已成功处理了请求,但返回的信息可能来自另一来源
    
  • 204(无内容) - 服务器成功处理了请求,但没有返回任何内容
    
  • 205(重置内容) - 服务器成功处理了请求,但没有返回任何内容。与 204 响应不同,此响应要求请求者重置文档视图(例如,清除表单内容以输入新内容)
    
  • 206(部分内容) - 服务器成功处理了部分 GET 请求
    
  • 300(多种选择) - 针对请求,服务器可执行多种操作。服务器可根据请求者 (user agent) 选择一项操作,或提供操作列表供请求者选择
    
  • 301(永久移动) - 请求的网页已永久移动到新位置。服务器返回此响应(对 GET 或 HEAD 请求的响应)时,会自动将请求者转到新位置。您应使用此代码告诉 Googlebot 某个网页或网站已永久移动到新位置
    
  • 302(临时移动) - 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来响应以后的请求。此代码与响应 GET 和 HEAD 请求 的 301 代码类似,会自动将请求者转到不同的位置,但您不应使用此代码来告诉 Googlebot 某个网页或网站已经移动,因 为 Googlebot 会继续抓取原有位置并编制索引
    
  • 303(查看其他位置) - 请求者应当对不同的位置使用单独的 GET 请求来检索响应时,服务器返回此代码。对于除 HEAD 之外的所有请求,服务器会自动转到其他位置
    
  • 304(未修改) - 自从上次请求后,请求的网页未修改过。服务器返回此响应时,不会返回网页内容;如果网页自请求者上次请求后再也没有更改过,您应将服务器配置为返回此响应(称为 If-Modified-Since HTTP 标头)。服务器可以告诉搜索引擎的蜘蛛/机器人 自从上次抓取后网页没有变更,进而节省带宽和开销
    
  • 305(使用代理) - 请求者只能使用代理访问请求的网页。如果服务器返回此响应,还表示请求者应使用代理
    
  • 307(临时重定向) - 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来响应以后的请求。此代码与响应 GET 和 HEAD 请求 的 301 代码类似,会自动将请求者转到不同的位置,但您不应使用此代码来告诉 Googlebot 某个页面或网站已经移动,因 为 Googlebot 会继续抓取原有位置并编制索引
    
  • 400(错误请求) - 服务器不理解请求的语法
    
  • 401(未授权) - 请求要求身份验证。对于登录后请求的网页,服务器可能返回此响应
    
  • 403(禁止) - 服务器拒绝请求。如果您在 Googlebot 尝试抓取您网站上的有效网页时看到此状态码(您可以在 Google 网站管理员工具诊断下的网络抓取页面上看到此信息),可能是您的服务器或主机拒绝了 Googlebot 访问
    
  • 404(未找到) - 服务器找不到请求的网页。例如,对于服务器上不存在的网页经常会返回此代码;如果您的网站上没有 robots.txt 文件,而您在 Google 网站管理员工具"诊断"标签的 robots.txt 页上看到此状态码, 则这是正确的状态码。但是,如果您有 robots.txt 文件而又看到此状态码,则说明您的 robots.txt 文件可能命名错误或位于错误的位 置(该文件应当位于顶级域,名为 robots.txt);如果对于 Googlebot 抓取的网址看到此状态码(在"诊断"标签的 HTTP 错误页面上),则表示 Googlebot 跟随的可能是另一个页面的无效链接(是旧链接或输入有误的链接)
    
  • 405(方法禁用) - 禁用请求中指定的方法
    
  • 406(不接受) - 无法使用请求的内容特性响应请求的网页
    
  • 407(需要代理授权) - 此状态码与 401(未授权)类似,但指定请求者应当授权使用代理。如果服务器返回此响应,还表示请求者应当使用代理
    
  • 408(请求超时) - 服务器等候请求时发生超时
    
  • 409(冲突) - 服务器在完成请求时发生冲突。服务器必须在响应中包含有关冲突的信息。服务器在响应与前一个请求相冲突的 PUT 请求时可能会返回此代码,以及两个请求的差异列表
    
  • 410(已删除) - 如果请求的资源已永久删除,服务器就会返回此响应。该代码与 404(未找到)代码类似,但在资源以前存在而现在不存在的情况下,有时会用来替代 404 代码。如果资源已永久移动,您应使用 301 指定资源的新位置
    
  • 411(需要有效长度) - 服务器不接受不含有效内容长度标头字段的请求
    
  • 412(未满足前提条件) - 服务器未满足请求者在请求中设置的其中一个前提条件
    
  • 413(请求实体过大) - 服务器无法处理请求,因为请求实体过大,超出服务器的处理能力
    
  • 414(请求的 URI 过长) - 请求的 URI(通常为网址)过长,服务器无法处理
    
  • 415(不支持的媒体类型) - 请求的格式不受请求页面的支持
    
  • 416(请求范围不符合要求) - 如果页面无法提供请求的范围,则服务器会返回此状态码
    
  • 417(未满足期望值) - 服务器未满足"期望"请求标头字段的要求
    
  • 500(服务器内部错误) - 服务器遇到错误,无法完成请求
    
  • 501(尚未实施) - 服务器不具备完成请求的功能。例如,服务器无法识别请求方法时可能会返回此代码
    
  • 502(错误网关) - 服务器作为网关或代理,从上游服务器收到无效响应
    
  • 503(服务不可用) - 服务器目前无法使用(由于超载或停机维护)。通常,这只是暂时状态
    
  • 504(网关超时) - 服务器作为网关或代理,但是没有及时从上游服务器收到请求
    
  • 505(HTTP 版本不受支持) - 服务器不支持请求中所用的 HTTP 协议版本
    

五、部署httpd服务


1.准备工作

  • rpm -e httpd --nodeps //卸载使用RPM方式安装的httpd
  • sed -i '/HOSTNAME/d;aHOSTNAME=www.hiahia.com' /etc/sysconfig/network //修改主机名
  • sed -i 'a127.0.0.1 www.hiahia.com' /etc/hosts //在hosts文件中添加主机名
  • 所需的软件包(arp;apr-util;pcre为httpd的依赖) httpd-2.4.34:http://httpd.apache.org apr-1.6.3;apr-util-1.6.1:https://apr.apache.org/ pcre-8.37:https://ftp.pcre.org/pub/pcre/

2.源码编译及安装

(1)安装依赖apr

tar -jxvf apr-1.6.3.tar.bz2 -C /usr/src/    //解压源码包
cd /usr/src/apr-1.6.3    //进入解压的目录
./configure --prefix=/usr/local/apr    //指定安装目录
make && make install    //编译并安装

(2)安装依赖apr-util

tar -jxvf apr-util-1.6.1.tar.bz2 -C /usr/src/
cd /usr/src/apr-util-1.61
./configure --prefix=/usr/local/apr-util --with-apr=/usr/local/apr    //指定安装目录和apr安装位置
make && make install

(3)安装依赖pcre

tar -jxvf pcre-8.37.tar.bz2 -C /usr/src/
cd /usr/src/pcre-8.37
./configure --prefix=/usr/local/pcre 
make && make install

(4)安装httpd

tar -zxvf httpd-2.4.34 -C /usr/src/    //解压httpd源码包
cd /usr/src/httpd-2.4.34
./configure --prefix=/usr/local/httpd --enable-so --enable-charset-lite --enable-rewrite --enable-cgi --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr-util --with-pcre=/usr/local/pcre    //配置安装选项

选项

--prefix:指定程序安装目录

--enable-so:启动动态加载模块支持,使其具有扩展能力;是用来提供DSO支持的核心模块

--enable-rewrite:启动网页地址重写功能,用于网站优化及目录迁移维护

--enable-charset-lite:启用字符集支持,以支持使用各种字符集编码的网页

--enable-cgi:启用CGI脚本程序支持,扩展网站的应用访问能力;通常执行CGI会涉及到安全问题,系统的任何都可以调用,所以,一般会把CGI放在一个特定的目录下执行

--with-apr:指定apr安装目录

--with-apr-util:指定apr-util安装目录

--with-pcre:指定pcre安装目录

make && make install //编译并安装

3.确认安装结果

ls /usr/local/httpd

服务目录:/usr/local/httpd/

主配置文件:/usr/local/httpd/conf/httpd.conf

网页目录:/usr/local/httpd/htdocs/

服务脚本:/usr/local/httpd/bin/apachectl

执行程序:/usr/local/httpd/bin/httpd

访问日志: /usr/local/httpd/logs/access_log

错误日志: /usr/local/httpd/logs/error_log

4.优化执行路径

ln -s /usr/local/httpd/bin/* /usr/local/bin/    //添加到PATH搜索路径中,用户不需完整命令路径即可使用

5.添加httpd为系统服务

cp /usr/local/httpd/bin/apachectl /etc/init.d/httpd    //拷贝默认脚本文件到系统控制目录
vim /etc/init.d/httpd
#chkconfig:35 66 66		//服务识别参数,指定3、5级别顺序启动标识号
#description:Startup script for the Apache HTTP Server    //文件开头添加chkconfig识别配置,不添加chkconfig添加服务时报错

chkconfig --add httpd			//将httpd添加为系统服务

六、httpd服务器的基本配置


1.Web站点的部署过程

(1)确定网站名称、IP地址

需申请合法公网IP地址,并向DNS提供商申请域名,做对应主机的DNS解析记录 公司内部使用可自行配置,无需公网IP,但如需内部使用域名可搭建DNS并对对应解析记录添加,修改/etc/hosts文件提高本地解析速度

(2)配置并启动httpd服务

vim /usr/local/httpd/conf/httpd.conf			//编辑httpd主配置文件
...
   ServerName www.hiahia.com:80
...
//寻找该行(97行) ,设置网站名称

apachectl -t    //检测httpd.conf文件是否有语法错误;“Syntax OK”则无误
/etc/init.d/httpd start     //启动httpd服务
netstat -utpln | grep httpd    //过滤是否开启服务

(3)部署网页

编译安装的httpd服务,网站根目录为/usr/local/httpd/htdocs目录下,将网页文档复制到此目录即可;默认提供index.html测试网页

(4)在客户端访问网站主页

(5)查看站点访问情况

访问日志: /usr/local/httpd/log/access_log

错误日志: /usr/local/httpd/log/error_log

2.httpd.conf配置文件

Apache官方文档:http://httpd.apache.org/docs/2.4/

(1)全局配置项

ServerRoot:服务目录

ServerAdmin:管理员邮箱

User:运行服务的用户身份;默认daemon

Group:运行服务的组身份;默认daemon

ServerName:网站服务器的域名

DocumentRoot:网页文档的根目录

Listen:监听的IP地址、端口号;默认80端口

DirectoryIndex:默认的索引页文件;默认首页文件index.html

ErrorLog:错误日志文件的位置

CustomLog:访问日志文件的位置;默认类型common

LogLevel:记录日志的级别,默认为warn(警告)

Timeout:网络连接超时,默认为300秒

KeepAlive:是否保持连接,可选On或Off

MaxKeepAliveRequests:每次连接最多请求文件数

KeepAliveTimeout:保持连接状态时的超时时间

Include:需要包含进来的其他配置文件

(2)区域配置项(常用)

httpd-2.2.X <Directory /> 限制根目录的访问权限 Options FollowSymLinks AllowOverride None Order deny,allow 访问控制策略的应用顺序;先检查禁止设定,没有禁止的全部允许 Deny from all 禁止任何人访问此区域 </Directory> httpd-2.4.X <Directory /> 限制根目录的访问权限 Options FollowSymLinks 控制选项,允许使用符号链接;访问到符号连接时,是否跳转到对应的连接路径 AllowOverride None 不允许隐含控制文件中的覆盖配置;是否去找.htaccess文件作为配置文件 Require all granted 允许任何人访问此区域 </Directory>

七、网站访问情况统计


1.部署AWStats分析系统

(1)安装awstats软件包

awstat:http://www.awstats.org/

tar -zxvf awstats-7.7.tar.gz    //解包
mv awstats-7.7 /usr/local/awstats    //移动解压缩目录;该软件为绿色版直接可用

(2)修改httpd配置文件

//CGI脚本模块支持和访问权限设置

(3)安装perl环境支持

yum -y install perl perl-devel perl-CGI

(4)为要统计的站点建立配置文件

cd /usr/local/awstats/tools/    //进入工具目录
chmod +x awstats_configure.pl    //给予配置脚本执行权限
./awstats_configure.pl    //运行配置脚本

指定httpd主配置文件路径

设置日志类型

为指定Web站点创建配置文件

后续配置工作

接下来会自动重启httpd服务(前提/etc/init.d/httpd脚本存在) 如若还需统计其它站点,再次运行./awstats_configure.pl

(5)修改站点统计配置文件

vim /etc/awstats/awstats.www.hiahia.com.conf
50   LogFile="/usr/local/httpd/logs/access_log"    //指定httpd访问日志所在位置
mkdir /var/lib/awstats    //创建数据存放目录

(6)执行日志分析并设置周期性计划任务

chmod +x awstats_updateall.pl			//给予更新脚本执行权限
./awstats_updateall.pl now		//立即更新awstats信息并统计到统计数据库中
crontab -e
*/5 * * * *  /usr/local/awstats/tools/awstats_updateall.pl now
/etc/init.d/crond start && chkconfig --level 35 crond on

2.web访问AWStats分析系统

浏览器访问http://192.168.1.151/awstats/awstats.pl?config=www.hiahia.com

也可通过编写网页跳传,实现自动跳传网页,简化访问地址 vim /usr/local/httpd/htdocs/awstats.html <html> <head> <meta http-equiv=refresh content="0;url=http://192.168.1.151/awstats/awstats.pl?config=www.hiahia.com"> </head> <body> </body> </html> 浏览器访问:http://192.168.1.151/awstats.html