学SEO,你要知道搜索引擎的工作原理。首先,搜索引擎不是人类。人类自己浏览网页与搜索引擎浏览网页之间的区别,这个并不是每个人都知道的。不像人类浏览网页,搜索引擎是文本驱动的。虽然人类的科技发展很迅速,但是搜索引擎不是人类,不会感觉到页面有多么的美,或者享受页面上的音乐和电影。相反,搜索引擎抓取网页,查看站点的所有信息(主要是文本),然后得出一个结论,这个站点是关于什么的。这个简单的解释不是最精确的,因为搜索引擎会做很多事情来产生搜索结果——抓取页面、建立索引、处理请求、计算相关度、得出搜索结果。
一、抓取页面
首先,搜索引擎抓取页面,看这个页面上有些什么内容。这个任务由一种称为爬虫或蜘蛛的软件来完成。蜘蛛跟随着网页上的链接,从一个网页爬行到另一个网页,然后对每一个在路上找到的东西建立索引。记住,网上有超过200亿个网页,蜘蛛不可能每天访问一个站点去看看有没有产生新的页面,或者已经存在的页面是否被修改过。有时候,蜘蛛可能一两个月都不会访问你的站点。
你能做的就是检查爬虫会从你的站点看到什么。上面已经提到,爬虫不是人类,他们不会看到图片、flash、javascript、frames、受密码保护的页面和路径,所以,如果你的站点上有很多这种东西,请确认爬虫是否能看到这些东西。如果看不到,那爬虫就不会处理这些东西。总之,对于搜索引擎来说,这些东西都是不存在的。
二、建立索引
搜素引擎抓取一个页面后,下一步就是对它的内容建立索引。那些建立了索引的页面被保存在一个巨大的数据库里,以后,搜索引擎就从数据库里获取页面。从本质上来说,建立索引就是识别最能描述这个页面的关键字,把这个页面指定给这些关键字。人类是不可能去处理这么巨量的信息的,而搜索引擎却能很好地完成这个任务。有时候,搜索引擎并不能很正确地理解页面,但是你可以优化页面,帮助搜索引擎理解页面。这样,搜索引擎就能更容易对你的页面进行分类,而且,你的页面也可以得到一个更高的排名。
三、处理请求
当一个搜索请求来了,搜索引擎处理它,比较搜索请求中的字符串和数据库中建立了索引的页面。数据库中很多页面包含这个字符串,实际上可能有数百万个这样的页面,然后搜索引擎开始计算每个页面的相关度。
四、计算相关度
计算相关度的算法有很多。每种算法对关键字密度、链接数和meta标签之类的因素,都有不同的权重。所以,对于相同的字符串,不同的搜索引擎会给出不同的搜索结果。所有的主流的搜索引擎,像谷歌、百度、雅虎、Bing等等,都是这样的。搜索引擎会定期地改变算法,如果你想要自己的网站排在最上面,你也必须使自己的网页适应最新的算法。如果你想要自己的网页排在最上面,你必须坚持花精力去SEO自己的网页,同时,你的竞争对手也会不断SEO他们的网页。
五、得出搜索结果
最后一步,搜索引擎取回搜索结果,把它展示在浏览器上,从最符合到最不符合。
这样,你就明白搜素引擎的工作原理了吧。