计算机文献检索策略

第二节 计算机文献检索策略 计算机文献信息检索包含制定检索表达式、制定合理的检索策略、检索策略的调整三个过程 一、检索表达式及构成要素 二、计算机检索策略的制定 三、调整计算机检索策略 检索表达式的基本含义:检索表达式是一个既能反映检索课题内容、又能为计算机识别的式子,是进行计算机文献信息检索的依据 它主要是运用各种逻运算符号、逻辑位置符号及逻辑限制符号,把检索词连接组配起来,确定检索词之间的关系,准确表达检索课题的内容 构成检索表达式的基本要素 (一)检索词 (二)运算符 检索词:表达检索课题主题概念的名词术语,包括叙词和自由词。叙词是规范词,大型数据库都有自己专用的词表,检索者可以从选择合适的词进行检索。 关键词:是未经过规范化的人工语言,往往是各学科通用的专业名词术语、惯用语及新出现的专有名词,所以在检索时应从有关专业文献或专业词典中选取关键词。 构成检索表达式的基本要素 (一)检索词 (二)运算符 1.布尔逻辑算符 常用的布尔逻辑算符有三种,分别是逻辑或OR,逻辑与AND,逻辑非NOT。下面分别简释它们各自的含义与用法。 (1)逻辑或“OR” 逻辑或“OR”可以扩大信息的检索范围,使用它相当于增加检索词主题的同义词与近义词,能提高检索的查全率。 (2)逻辑与“AND” 逻辑与“AND”可以缩小信息的检索范围,提高检索的查准率。 (3)逻辑非“NOT” 逻辑非“NOT”可以用来排除不希望出现的检索词,它与逻辑与“AND”的作用类似,能够缩小命中信息的范围,提高检索的查准率。 2.邻近检索 位置检索也叫全文检索、邻近检索。所谓全文检索,就是利用记录中的自然语言进行检索,词与词之间的逻辑关系用位置算符组配,对检索词之间的相对位置进行限制。 这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。不同的检索系统其位置算符的表示方法不尽相同,美国DIALOG 检索系统的位置算符的用法意义如下: (1)(W)—With (W)表示该算符两侧的检索词相邻,且两者之间只允许只有一个空格或标点符号,不允许有任何字母或词,顺序不能颠倒。(W)也可以简写为( )。 例如: Aircraft( )design 可检索出含有Aircraft design 的文献记录。 Computer( )aided( )design 可检索出含有Computer aided design 的文献记录。 (2) (nW)—nWords (nW)表示在此算符两侧的检索词之间最多允许间隔n 个词(实词或虚词),且两者的相 对位置不能颠倒。 例如:laser(1w)printer 可检出含有laser printer 和laser color printer 的文献记录。 (3) (N)—Near (N)表示该算符两侧的检索词相邻,但两者的相对位置可以颠倒。 例如:computer(N)network 可检出含有computer network、network computer 形式的文献记录。 (4)(nN)—nNear (nN)表示此算符两侧的检索词之间允许间隔最多n 个词,且两者的顺序可以颠倒。 例如 computer(2N)system 可检出含有computer system,computer code system, computer aided design system,system using modern computer 等形式的文献记录。 (5)(S)—Subfield (S)表示其两侧的检索词必须是在文献记录的同一子字段中,而不限定它们在该子字段中的相对次序和相对位置的距离。在文摘字段中,一个句子就是一个子字段。 例如computer( )control(s)system 可检出文摘中含有“This paper is concerned with an application of the computer control technique in a intelligent system for testing inner walls of pipes.”这样一句话的文献记录。 这样的文献记录也是可以被检索到的“Design of a System for Data Acquisition and Computer Control of a Pulmonary Physiology Lab” (6)(F)—Field (F)表示其两侧的检索词必须是在文献记录的同一字段中,而它们在该字段中的相对次序和相对位置的距离不限。 例如:water( )pollution(F)control 表示在同一个字段中(如篇名、文摘、叙词等)同时含有water pollution 和control 的文献记录均可检索出来。