搜索引擎的出现,整合了互联网上众多的网页资源,并提供信息导航和信息查询服务, 使信息的价值得到了网民和厂商的普遍认可。但是,搜索引擎的发展格局是多方面的,市场 需求的多元化也导致了搜索引擎的行业化和细分化,从而“垂直搜索引擎”成为了搜索引擎 发展的必然趋势之一。

一般认为:垂直搜索引擎是针对某一个行业或组织,满足行业专业需求、或者组织某 项业务需求的专业搜索引擎,是搜索引擎的细分和延伸,是对某类网页资源和结构化资源的 深度整合,并为用户提供符合专业用户操作行为的信息服务方式。 下图展示了垂直搜索、企业搜索、互联网搜索的区别。

信息采集:融合了互联网搜索和企业搜索的特点     

垂直搜索则采用被动和主动想结合的方 式,通过主动方式,有效采集网页中标引的元数据,整合上下游网页资源或者商业数据库, 提供更加准确的搜索服务。如:中华人民共和国中央人民政府网站垂直搜索引擎,它通过规 范副省级政府门户网站网页的表达方式,达到有效采集网页元数据的目的,为企业和个人提 供更精准的政务信息搜索服务。 从采集深度、动态网页采集的优先级、结构化数据库信息采集来看,互联网搜索采用广度为先的策略,所以对采集深度要求不高,而垂直搜索和企业搜索需要挖掘出行业内所有 相关的网页信息,所以往往采用深度为先的策略,同时由于行业内的一些有商业价值的信息 采用动态发布的方式,如:企业数据库、供求信息等,所以垂直搜索对动态网页的采集优先 级别较高。在实际应用中,垂直搜索和企业搜索都需要集成和采集关系数据库中的结构化信 息,如:垂直搜索中政府需要集成法律法规库、企业搜索中需要采集ERP 、CRM中的信息 等。

信息加工:非结构化信息结构化是垂直搜索的特色

目前,从垂直搜索的应用情况看,大部分垂直搜索的结构化信息提取都是依靠手工、半 手工的方式来完成的,面对互联网的海量信息,很难保证信息的实时性和有效性,对智能化 的结构化信息提取技术的需求非常迫切。但因目前国内非结构化信息的智能提取技术取得了 重大进展,在一些领域得到了有效应用,因此智能化成为了垂直搜索引擎的发展趋势。

信息检索:结构化和非结构化相结合的检索方式     

而垂直搜索的排序需求更加多样化,如:按时间排 序、按相关度排序、按某个结构化字段排序(如:购物搜索中的按价格排序等等)。