在此先介绍搜索引擎收录必经的四个步骤:抓取、过滤、索引、展现。通常意义的收录量,指的就是被搜索引擎展现出来的网站网页的数量。

这些SEO禁区导致网站内容不收录

1、网站SEO作弊,或有黑帽SEO历史

  网站存在SEO作弊情况,如最常见的关键词堆砌,内链堆砌,快速排名等;或者网站域名曾经有过黑帽SEO历史,正处于被搜索引擎惩罚阶段。这种情况可能导致网站内容不被收录。

2、robots.txt曾经屏蔽搜索引擎抓取

  在搜索引擎收录必经的四个步骤中,抓取是第一步骤。Robots文件禁止搜索引擎抓取,网站内容自然无法被收录。但是也存在另外一种情况,那就是robots.txt文件曾经屏蔽过搜索引擎,在被屏蔽期间搜索引擎多次访问无果。此后即便robots.txt文件解封,搜索引擎也可能不会抓取。

  解决方法是:①验证百度站长工具;②在网页抓取栏中有一项“robots”,对robots文件进行检测并更新;③提交网页链接。

3、网站不稳定

  网站存在以下情况,也容易导致网站内容不被收录:

  A、网站频繁修改网站标题;

  B、更换网站域名、空间、IP;

  C、更换网站模板;

  D、网站频繁改版;

  上述情况都会改变搜索引擎对网站的固有印象,网站改变过后,搜索引擎需要对网站进行重新判断,这段时间内,网站更新内容可能不被收录。

4、网站不被收录常见情况分析

  A、搜索引擎无法抓取

  网站重要页面入口采用js设置,或大量采用iframe框架结构,会导致网站内容无法被百度抓取。

  B、搜索引擎根本没抓取

  分析网络日志或查看百度站长工具“抓取频次”,看百度是否有过抓取记录。若没有,需要站长主动提交。

  C、有抓取,没收录

  在文章开篇我们已经说过网站内容被被搜索引擎收录必经的四个步骤,抓取只是第一步。有抓取没收录可能存在两种情况:

  ①网站内容被百度抓取后,已经放到索引库,暂时没有放出来;这种情况常发生在新站,可能一个月只收录一个首页,而后突然一天收录量暴增,对此,站长只要继续保持更新即可;

  ②网站内容质量差,导致网站内容不收录,这往往是网站不收录的根本原因。