网站日志是站长与搜索引擎对话的一个真实记录。因此读懂了网站日志,也就读懂了搜索引擎对网站的态度。
一、通过分析日志你能获得什么信息呢?
1、新站刚上线,看搜索引擎蜘蛛的抓取情况; 2、网站收录异常,被抜毛时,对比日志中蜘蛛的行为情况; 3、解决网站被K时,观察日志情况。
二、如何找到网站日志文件?
通过查找FTP根目录,一般为一个包含logs文件夹,不同的服务器可能日志文件命名不一样,但都会包含logs这个关键词,如下图:
三、如何打开网站日志文件?
下载,解压后,可以用文本编辑器打开,如果打开是乱码的话,可以用Editplus或dreamweaver等网页编辑器打开。
四、各大搜索引擎蜘蛛名称:
百度:baiduspider
Google=Googlebot
Msn:msnbot
yahoo:Slurp
yodao:YoudaoBot
sogou:Sogou+get+spider
360:360Spider
五:日志拆解
在日志里面搜索以上蜘蛛的名称就可以找到蜘蛛抓取的痕迹。
具体分析如下:
123.125.71.33 访问IP
[19/Apr/2013:00:47:39 +0800] 访问时间与时区
GET /page/contact/contact.php HTTP/1.1
200
21978 表示抓取了21978个字节。
Mozilla/5.0
六、网站日志对seo有关于的信息,
不同的服务器或虚拟主机设置的日志记录内容不同。 有的如:200 0 33834 237 953
在日志里,发现比较多的HTTP状态码是,200(正常)、304(没变化)、404(错误链接)。 304代表,自从上次抓取后,该内容没有更新。一般情况下,网站的图片经常会返回该值。 404代表,访问的这个链接是错误链接。这个错误链接,一方面来自原本存在后来删除了网页,另一方面可能来自本来就不存在,但其他人外链了这么个死链接。
文章转自:www.ecpte.com