真题题目:《搜索引擎的工作原理》

真题出处:2019 年下

内容:

搜索引擎的工作原理

搜索引擎不能真正实时地在因特网上捜索信息,而是搜索预先整理好的网页索引数据库。它

不能真正理解网页上的内容, 只能机械的匹配网页上的文字。

真正意文上的搜索引擎,通常指收集了因特网上几千万乃至几十亿个网页并对网页中的每一

个词(搜索的关键词)进行索引。建立索引数据库的全文搜索引擎。当用户输入某个关键词进

行检索时,所有页面内容中包含了该关键词的网页都被作为搜索结果进行处理。在经过一些

算法进行排序后,搜索到的结果最终按照与搜索关键词相关程度的高低依次排列出来。

搜索引擎的整个工作过程可以简单的理解为三步:一是从互联网上抓取网页,二是建立索引

数据库,三是在索引数据库中对搜索结果进行排序,如图所示。

搜索引擎架构标准 搜索引擎的结构和原理_搜索引擎

(1)从因特网上抓取网页

搜索引擎利用能够从因特网上自动收集网页的“蜘蛛”(Spider)系统程序,自动访问因特网,

沿着网页中的所有链接“爬”到其他网页,重复这一过程,并把所有“爬”过的网页收集过

来。

(2)建立索引数据库

分析索引程序对收集回来的网页进行分析,提取相关网页信息,包括网页的 URL,编码类型,

页面内容包含的所有关键词,关键词的位置、生成时间、大小、与其他网页的链接关系等,

根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字及链接中每一个关

键词的相关程度(或重要性),然后用这些相关信息建立网页索引数据库。

(3)在索引数据库中对搜索结果进行排序

当用户输人关键词搜索后,搜索系统程序就从网页索引数据库中查找与该关键词相匹配的所

有网页。然后根据这些网页与关键词的相关程度,对搜索到的数值进行排序。一般来讲,相

关程度越高,排的次序越靠前。

一、三维目标

知识与技能:了解搜索引擎的工作原理;了解搜索引擎的工作过程;能够使用图示将搜索引擎的工作过程画出来;

过程与方法:

情感态度价值观:

 

二、重难点

重点:了解搜索引擎的工作原理;了解搜索引擎的工作过程;

难点:能够使用图示将搜索引擎的工作过程画出来;

 

三、教学环节

(导入)

在之前的课堂中,我们学习了搜索引擎的相关知识。现在老师带领同学们复习一下。

如果老师想要去山东旅游,想上网找一找山东的旅游景点和特产,老师应该使用哪种搜索引擎进行搜索呢?

嗯,非常好,老师可以使用全文搜索引擎。

那么老师想要找今天每一场nba比赛的赛果,老师应该使用哪一种搜索引擎进行搜索呢?

没错,使用目录搜索引擎,比如新浪、搜狐等

那么还有一种搜索引擎能够将多个搜索引擎的搜索结果进行汇总,它叫什么名字?

非常好,就是我们的元搜索引擎。

同学们回答的都非常迅速并且准确,那么搜索引擎的工作原理是什么呢?它是如何将搜索结果返回给用户的?今天就让我们学习《搜索引擎的工作原理》这堂课,来找一找这些问题的答案吧!

 

(新授)

首先,老是想问同学们一个问题,搜索引擎是实时的在因特网上搜索信息吗?

有同学点头了,也有同学不同意。同学们请观看一段视频,告诉老师正确的答案。

同学们心中有答案了吗?

这位同学说,搜索引擎不是实时地在因特网上搜索信息的,而是将搜索结果预先放进网页的索引数据库中,当我们用户输入想要查找的内容时,搜索引擎就会去数据库搜索匹配搜索内容的结果。非常好,请坐。

其实,真正意义上的搜索引擎,通常指收集了因特网上几千万乃至几十亿个网页并对网页中的每一个词进行索引。建立索引数据库的全文搜索引擎。当用户输入某个关键词进行检索时,所有网页内容中包含了该关键词的网页都被作为搜索结果进行处理。在经过一些算法进行排序后,搜索到的结果最终按照与搜索关键词相关程度的高低依次排列出来。同学们听懂了吗?

看到有的同学还对这个知识点不太明白,老师再总结一下,简单来说,搜索引擎的工作过程能够分为三步:

第一步,从互联网上抓取网页。

第二步,建立索引数据库。

第三步,在索引数据库中对搜索结果进行排序。

现在请同学们自行阅读书本,想一想在这三个步骤中,搜索引擎它具体做了什么呢?

搜索引擎架构标准 搜索引擎的结构和原理_数据库_02