布尔逻辑算符
计算机检索技术及中文数据库使用方法 职工专题培训 主讲 段晓玲 一、计算机信息检索的基本技术: 布尔逻辑算符、截词算符、位置算符、字段限定检索等等。 在进行计算机检索时,有时有一些比较复杂的课题,如:“GPS在建筑中的应用”,既涉及GPS,又涉及建筑,还有“应用”,这时候就要编制出满足要求的计算机检索式,它是机检的基础。 一、计算机信息检索的基本技术 布尔逻辑算符、截词算符、位置算符、字段限定检索等等。 在进行计算机检索时,有时有一些比较复杂的课题,如:“GPS在建筑中的应用”,既涉及GPS,又涉及建筑,还有“应用”,这时候就要编制出满足要求的计算机检索式,它是机检的基础。 1布尔逻辑检索(Boolean Logic Retrieval) 逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符(Boolean Logic Operators),即与、或、非三种运算符号,用它们可以表示概念之间的逻辑关系。 2 位置算符(Proximity Operators) 位置算符是表示检索词之间位置关系的一种运算符。由于英文对一句话有多种表达方法,写法可能不同。如:“GPS在铁路桥研究中的应用”这个课题,用英文表达可能是“Using of GPS in Railway Bridge”, 也可能是“Using of GPS in Bridge of Railway”,因而可能编制出这样的检索式,GPS AND (Railway (2N)Bridge)我们可以通过位置检索提高检索的准确率 (1) (W)算符与(nW)算符 W 是word与 with的缩写。 特点:W词序不变,中间不可插词,但两词间可有一个标点,连字符或空格。 nW词序不变,中间可插入N 个词。 如:potential (w) energy可能检出potential energy and function 又如:gone (2w)wind 可能检出gone with the wind (2) (N)与(nN)算符 N是near的缩写 特点:N词序不限,中间不可插词,但两词间可有一个标点,连字符或空格。 nN词序不限,中间可插入N 个词。 如:econom?? (2N)recovery可能检出economic recovery,recovery of the economy, (3)同字段检索A(F)B,F是field的缩写。 特点:A、B两词必须出现在同一字段中,词序与词量不限。 如:environment (F)impact/DE,表示两个词必须同时出现在叙词字段内。 (4) 同句检索A(S)B,S是sentence的缩写。 特点:A、B出现在同一自然句中(子字段),其词序与词量不受限制。 如:electric (S)plant可检出electric power plants如:EI中的NEAR;PQDD中的W/n (两词间距小于n个单词,且前后位置任意),Pre/n (两词间距小于n个单词,且前后位置一定) 3截词算符(Truncating operators) 在英语词汇中,一个词可能有多种形态,如词的单、复数形式的不同,英美拼写方法不同、词性不同等。如果检索时将这类词全部输入进去,会增加检索时间和费用,采用截词法可解决这一问题。 所谓截词检索,是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中计算机会将所有含有相同部分标识的记录全部检索出来。常用“?”、“*”符号表示。 (1)有限截断。是指在检索词后后截几个有限的字母,如名词的单复数,动词的词尾变化等。如输入computer? ?表示有0-1个字母变化,可检出computer和computers. 输入stud???表示截断处有0-3个字母变化,可检出study,studies,studied,studing. (2)无限截断:在检索词后加一个“?“,表示该词后可加任意个字符。使用无限截词,所截词根不能太短,否则会输出许多无关文献,造成误检。 如:computer?可检出computers,computering,computered,computerization. (3)中间截断:在检索词中间加一个或几个?号,主要解决一些英美拼写不同,单复数形式的不同的词的输入,可简化输入。如:输入wom?n可检出 woman,wom