搜索引擎的工作原理

转载

feier7501 2023-04-26 18:28:21 博主文章分类：SEO

文章标签 搜索引擎工作数据库算法 javascript 文章分类 JavaScript 前端开发

学SEO，你要知道搜索引擎的工作原理。首先，搜索引擎不是人类。人类自己浏览网页与搜索引擎浏览网页之间的区别，这个并不是每个人都知道的。不像人类浏览网页，搜索引擎是文本驱动的。虽然人类的科技发展很迅速，但是搜索引擎不是人类，不会感觉到页面有多么的美，或者享受页面上的音乐和电影。相反，搜索引擎抓取网页，查看站点的所有信息（主要是文本），然后得出一个结论，这个站点是关于什么的。这个简单的解释不是最精确的，因为搜索引擎会做很多事情来产生搜索结果——抓取页面、建立索引、处理请求、计算相关度、得出搜索结果。

一、抓取页面

首先，搜索引擎抓取页面，看这个页面上有些什么内容。这个任务由一种称为爬虫或蜘蛛的软件来完成。蜘蛛跟随着网页上的链接，从一个网页爬行到另一个网页，然后对每一个在路上找到的东西建立索引。记住，网上有超过200亿个网页，蜘蛛不可能每天访问一个站点去看看有没有产生新的页面，或者已经存在的页面是否被修改过。有时候，蜘蛛可能一两个月都不会访问你的站点。

你能做的就是检查爬虫会从你的站点看到什么。上面已经提到，爬虫不是人类，他们不会看到图片、flash、javascript、frames、受密码保护的页面和路径，所以，如果你的站点上有很多这种东西，请确认爬虫是否能看到这些东西。如果看不到，那爬虫就不会处理这些东西。总之，对于搜索引擎来说，这些东西都是不存在的。

二、建立索引

搜素引擎抓取一个页面后，下一步就是对它的内容建立索引。那些建立了索引的页面被保存在一个巨大的数据库里，以后，搜索引擎就从数据库里获取页面。从本质上来说，建立索引就是识别最能描述这个页面的关键字，把这个页面指定给这些关键字。人类是不可能去处理这么巨量的信息的，而搜索引擎却能很好地完成这个任务。有时候，搜索引擎并不能很正确地理解页面，但是你可以优化页面，帮助搜索引擎理解页面。这样，搜索引擎就能更容易对你的页面进行分类，而且，你的页面也可以得到一个更高的排名。

三、处理请求

当一个搜索请求来了，搜索引擎处理它，比较搜索请求中的字符串和数据库中建立了索引的页面。数据库中很多页面包含这个字符串，实际上可能有数百万个这样的页面，然后搜索引擎开始计算每个页面的相关度。

四、计算相关度

计算相关度的算法有很多。每种算法对关键字密度、链接数和meta标签之类的因素，都有不同的权重。所以，对于相同的字符串，不同的搜索引擎会给出不同的搜索结果。所有的主流的搜索引擎，像谷歌、百度、雅虎、Bing等等，都是这样的。搜索引擎会定期地改变算法，如果你想要自己的网站排在最上面，你也必须使自己的网页适应最新的算法。如果你想要自己的网页排在最上面，你必须坚持花精力去SEO自己的网页，同时，你的竞争对手也会不断SEO他们的网页。

五、得出搜索结果

最后一步，搜索引擎取回搜索结果，把它展示在浏览器上，从最符合到最不符合。

这样，你就明白搜素引擎的工作原理了吧。