搜索引擎索引网页的非常复杂,这里只是给出大体的介绍。

首先网站必须被搜索引擎发现,最主要的方式是网站外链,如果没有外链,就是等待被搜索引擎发现了。

搜索引擎发现后,派出Spider,Spider按照一定的策略(算法)抓取网页。

抓取网页后确定网页的关键词,内容,内容与关键词的相关性,网页是否重复,是否高质量文章。涉及非常复杂的算法

将网页放入索引库,等待用户检索。

根据当前页面中的链接抓取同站或外站其它页面。