1、查看当天有多少个IP访问:
awk '{print $1}' log_file|sort|uniq|wc -l
2、查看某一个页面被访问的次数:
grep "/index.php" log_file | wc -l
3、查看每一个IP访问了多少个页面:
awk '{++S[$1]} END {for (a in S) print a,S[a]}' log_file
4、将每个IP访问的页面数进行从小到大排序:
awk '{++S[$1]} END {for (a in S) print S[a],a}' log_file | sort -n
5、查看某一个IP访问了哪些页面:
grep ^111.111.111.111 log_file| awk '{print $1,$7}'
6、去掉搜索引擎统计当天的页面:
awk '{print $12,$1}' log_file | grep ^\"Mozilla | awk '{print $2}' |sort | uniq | wc -l
7、查看2009年6月21日14时这一个小时内有多少IP访问:
awk '{print $4,$1}' log_file | grep 21/Jun/2009:14 | awk '{print $2}'| sort | uniq |
格式字符串 | 描述 | ||||||
---|---|---|---|---|---|---|---|
%% |
百分号(Apache2.0.44或更高的版本) | ||||||
%a |
远端IP地址 | ||||||
%A |
本机IP地址 | ||||||
%B |
除HTTP头以外传送的字节数 | ||||||
%b |
以CLF格式显示的除HTTP头以外传送的字节数,也就是当没有字节传送时显示’- ‘而不是0。 |
||||||
%{Foobar}C |
在请求中传送给服务端的cookieFoobar的内容。 | ||||||
%D |
服务器处理本请求所用时间,以微为单位。 | ||||||
%{FOOBAR}e |
环境变量FOOBAR的值 | ||||||
%f |
文件名 | ||||||
%h |
远端主机 | ||||||
%H |
请求使用的协议 | ||||||
%{Foobar}i |
发送到服务器的请求头Foobar: 的内容。 |
||||||
%l |
远端登录名(由identd而来,如果支持的话),除非IdentityCheck 设为”On “,否则将得到一个”-”。 |
||||||
%m |
请求的方法 | ||||||
%{Foobar}n |
来自另一个模块的注解Foobar 的内容。 |
||||||
%{Foobar}o |
应答头Foobar: 的内容。 |
||||||
%p |
服务器服务于该请求的标准端口。 | ||||||
%P |
为本请求提供服务的子进程的PID。 | ||||||
%{format}P |
服务于该请求的PID或TID(线程ID),format 的取值范围为:pid 和tid (2.0.46及以后版本)以及hextid (需要APR1.2.0及以上版本) |
||||||
%q |
查询字符串(若存在则由一个”? “引导,否则返回空串) |
||||||
%r |
请求的第一行 | ||||||
%s |
状态。对于内部重定向的请求,这个状态指的是原始请求的状态,—%>s 则指的是最后请求的状态。 |
||||||
%t |
时间,用普通日志时间格式(标准英语格式) | ||||||
%{format}t |
时间,用strftime(3) 指定的格式表示的时间。(默认情况下按本地化格式) |
||||||
%T |
处理完请求所花时间,以秒为单位。 | ||||||
%u |
远程用户名(根据验证信息而来;如果返回status(%s )为401,可能是假的) |
||||||
%U |
请求的URL路径,不包含查询字符串。 | ||||||
%v |
对该请求提供服务的标准ServerName 。 |
||||||
%V |
根据UseCanonicalName 指令设定的服务器名称。 |
||||||
%X |
请求完成时的连接状态:
(在1.3以后的版本中,这个指令是 |
||||||
%I |
接收的字节数,包括请求头的数据,并且不能为零。要使用这个指令你必须启用mod_logio 模块。 |
||||||
%O |
发送的字节数,包括请求头的数据,并且不能为零。要使用这个指令你必须启用mod_logio 模块。 |
http://www.huanxiangwu.com/517/apache-log-analysis-of-shell-phrase