[root@king data]# cat awk2.txt #测试文档
http://www.baidu.com/index.html
http://post.baidu.com/1.html
http://mp3.baidu.com/2.html
http://tiba.baidu.com/3.html
http://mvp.baidu.com/4.html
http://www.baidu.com/index.html
http://mvp.baidu.com/4.html
http://www.baidu.com/index.html
http://tiba.baidu.com/3.html
http://post.baidu.com/1.html
http://tiba.baidu.com/3.html
http://www.baidu.com/index.html
http://post.baidu.com/1.html
http://mp3.baidu.com/2.html
http://tiba.baidu.com/3.html
http://mvp.baidu.com/4.html
http://www.baidu.com/index.html
http://mvp.baidu.com/4.html
http://www.baidu.com/index.html
http://tiba.baidu.com/3.html
http://post.baidu.com/1.html
http://tiba.baidu.com/3.html
http://www.baidu.com/index.html
http://post.baidu.com/1.html
http://mp3.baidu.com/2.html
http://tiba.baidu.com/3.html
http://mvp.baidu.com/4.html
http://www.baidu.com/index.html
http://mvp.baidu.com/4.html
http://www.baidu.com/index.html
http://tiba.baidu.com/3.html
http://post.baidu.com/1.html
http://tiba.baidu.com/3.html
[root@king data]# awk -F "/" '{baidu[$3]++}END{for(name in baidu)print name,baidu[name]}' awk2.txt #分隔符为“/”取出域名,然后域名在第三列$3,然后给$3一个数组,END为取最后的结果,循环查找name里面baidu这个数组的数值,最后打印出以name里面的内容及baidu找到的总次数。
tiba.baidu.com 9
www.baidu.com 9
mvp.baidu.com 6
post.baidu.com 6
mp3.baidu.com 3