11.22 访问日志不记录静态文件

  • **背景:**因为网站大部分元素为静态文件,如图片、css、js等,这些元素对日志跟踪作用不大,为了节省日志空间,可以不用记录这些文件.

  • 设置访问日志不记录静态文件方法:

  • vim /usr/local/apache2.4/conf/extra/httpd-vhosts.conf

  • 把虚拟主机配置文件改成如下: <VirtualHost *:80> DocumentRoot "/data/wwwroot/123.com" ServerName 123.com ServerAlias www.example.com 2111.com SetEnvIf Request_URI ".*\.gif$" img SetEnvIf Request_URI ".*\.jpg$" img SetEnvIf Request_URI ".*\.png$" img SetEnvIf Request_URI ".*\.bmp$" img SetEnvIf Request_URI ".*\.swf$" img SetEnvIf Request_URI ".*\.js$" img SetEnvIf Request_URI ".*\.css$" img #博客格式原因,此处显示不对,正确请看截图 CustomLog "logs/123.com-access_log" combined env=!img </VirtualHost>

  • 以上SetEnvIf这几句的意思是定义一个环境变量,以标识请求URI中以gif,jpg,png等结尾的记录,然后通过env=!img这一语句将这些排除掉,这样日志文件中就不会记录这些占用存储空间大却又对于分析日志帮助不大的静态文件.

  • 重新加载配置文件: /usr/local/apache2.4/bin/apachectl -t /usr/local/apache2.4/bin/apachectl graceful

  • 测试结果:

  • 上传真实文件测试:

  • mkdir /data/wwwroot/123.com/images //创建目录,并在这目录下上传一个图片baidu.png

  • curl -x127.0.0.1:80 -I 123.com/images/baidu.png

  • tail /usr/local/apache2.4/logs/123.com-access_log

11.23 访问日志切割

  • 背景:网站日志一直记录着的话总有一天会把整个磁盘占满, 所以有必要让它自动切割, 并定期删除或转移老的日志文件(可做一个任务计划让系统定期自动删除/转移老日志文件),以便磁盘不会被日志文件占满(目的).
  • 设置访问日志切割的方法:
  • vim /usr/local/apache2.4/conf/extra/httpd-vhosts.conf 把虚拟主机配置文件改成如下: <VirtualHost :80> DocumentRoot "/data/wwwroot/23.com" ServerName 123.com ServerAlias www.example.com 2111.com SetEnvIf Request_URI ".*\.gif$" img SetEnvIf Request_URI ".*\.jpg$" img SetEnvIf Request_URI ".*\.png$" img SetEnvIf Request_URI ".*\.bmp$" img SetEnvIf Request_URI ".*\.swf$" img SetEnvIf Request_URI ".*\.js$" img SetEnvIf Request_URI ".*\.css$" img#博客格式原因,此处显示不对,正确请看截图 ** CustomLog "|/usr/local/apache2.4/bin/rotatelogs -l logs/123.com-access_%Y%m%d.log 86400" combined env=!img* </VirtualHost>
  • 以上CustomLog一行中,rotatelogs是apache自带的日志切割工具;-l参数是让它以当前系统时间为基准来切割(比如在中国是CST,在美国是UTC,不指定则以UTC为基准);%Y%m%d变量则是让切割的日志文件名加上当前日期以便区分;86400是一天的秒数(24x60x60),表示以1天的频率来进行切割.
  • 重新加载配置文件 /usr/local/apache2.4/bin/apachectl -t /usr/local/apache2.4/bin/apachectl graceful
  • 查看生成的日志文件: curl -x127.0.0.1:80 123.com/xxx.php #访问以让系统生成日志文件 ls /usr/local/apache2.4/logs

注意事项: 实际工作情境中,到这里并不算完成,还有更关键的一步,就是需要设置一个任务计划让系统定期自动删除或者转移老日志文件,否则的话,尽管日志文件已切割,但都还存留在磁盘上,时间久了还是会把磁盘写满.因此别忘了做任务计划这一更重要的一步!!!

11.24 静态元素过期时间

  • 背景:浏览器访问网站的图片时会把静态的文件缓存在本地电脑里,这样下次再访问时就不用去远程下载了.这样做的好处是可以节省(服务器)带宽,提高访问速度.但有一点不好的地方是这些静态文件缓存会一直在客户端电脑里,而且不会及时更新.因此有需要设置静态元素过期时间(这样当过期后,客户端浏览器会再次到远程服务器下载更新的内容).
  • 设置静态元素过期时间的方法:
  • vim /usr/local/apache2.4/conf/extra/httpd-vhosts.conf 增加配置: <IfModule mod_expires.c> ExpiresActive on //打开该功能的开关 ExpiresByType image/gif "access plus 1 days" ExpiresByType image/jpeg "access plus 24 hours" ExpiresByType image/png "access plus 24 hours" ExpiresByType text/css "now plus 2 hour" ExpiresByType application/x-javascript "now plus 2 hours" ExpiresByType application/javascript "now plus 2 hours" ExpiresByType application/x-shockwave-flash "now plus 2 hours" ExpiresDefault "now plus 0 min" </IfModule>
  • 需要编辑主配置文件以加载expires_module模块
  • 重新加载配置文件: /usr/local/apache2.4/bin/apachectl -t /usr/local/apache2.4/bin/apachectl graceful
  • 用curl进行测试 curl -x127.0.0.1:80 -I 123.com/images/baidu.png
  • 测试结果(cache-control: max-age,Expires)

  • 知识点: 在浏览器中,按Ctrl+F5可以强制刷新,把本地缓存清空.

扩展学习: apache日志记录代理IP以及真实客户端IP http://ask.apelearn.com/question/960 apache只记录指定URI的日志 http://ask.apelearn.com/question/981 apache日志记录客户端请求的域名 http://ask.apelearn.com/question/1037 apache 日志切割问题 http://ask.apelearn.com/question/566