第一讲信息检索基础知识﹝5﹞.ppt

  1. 1、本文档共117页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一讲信息检索基础知识﹝5﹞

* 逻辑与 A B A AND B A*B 缩小检索范围,提高专指性。 * 示例 糖尿病与高血压 A B 糖尿病 高血压 A AND B * 逻辑或 A OR B A+B A B 扩大检索范围,提高查全率。 示例 政治、经济、宗教与伦理学的关系 A C B (A OR B OR C) AND D (A+B+C)*D D 政治 经济 宗教 伦理学 * 逻辑非 A B A NOT B A-B 缩小检索范围,提高查准率。 * 示例 金属(有色金属) A:金属 B:黑色金属 A not B A-B * 逻辑运算次序 布尔逻辑运算次序 布尔逻辑的运算就象数学中的四则运算的“先乘除后加减”一样,也有优先级的问题,它的优先级从高到低依次为: 非(NOT)→与(AND)→或(OR) 当然,括号最优先。因此,括号也称为优先符。优先符可以改变布尔逻辑的正常运算次序。 如:信息+情报 NOT 经济 (信息+情报)NOT 经济 检索结果不同。 * 布尔逻辑的运算可以进行同类项的合并。 如:A*B+A*C=A*(B+C) 然而,在使用布尔逻辑时,必须注意以下几条交换规则: A*B=B*A A+B=B+A A-B≠B-A * 2. 截词检索 以符号取代检索词(中、尾)的部分字符,从而检出相同词干和相同词根的词。 截词包括后截、中截、前截等,是计算机信息检索的一项重要特性,不同数据库有不同的截词 符,常用的有“?”和“*”。 如 wom?n 可以检索出: woman, women 又如 computer?——以computer词干开头的词 可以检索出:computer、computers、computing、computerize、computerize * 词中替代: 名称 运算符 逻辑关系 举例 结果 截词 “?” (Wildcard Symbol) 替代单个字符 曲安?德 曲安耐德 曲安奈德 “ * ” Truncation Symbol 替代任意多个字符 肝炎*疫苗 肝炎灭活疫苗 肝炎减毒活疫苗 示例 1 示例 2 词尾截断: 名称 运算符 逻辑关系 举例 结果 截词 符 “ * ” Truncation Symbol 替代任意多个字符 computer、computers、computing、computerize、computerize Comput* * 以Dialog Medline 数据库为例: ⑴ With ??????? 运算符为“()” 表示检索词紧密相连,中间不能插入任何字母或词,但允许有“ ” 或“_”,前后顺序不能颠倒。 如 X()ray 表示 X ray 或 X-ray 由于逻辑算符不能限定检索词的位置关系,因此有些数据库和因特网检索系统采用了位置算符来加以限制 3 . 邻近检索 * (2)word 运算符为(nW)(n为自然数) 表示两词之间最多可插入0-n个词 前后顺序不能颠倒。 如:control(1w)system 可以检索出 “control system” “control in system” “control of system” 等的信息。 * (3) near 运算符为“(nN)” 表示检索词相邻,中间可插入0-n个词,前后顺序可以颠倒 如 education(nN)school 表示: education school, education schools school of education, education and music school * (4) sentence 运算符为“(S)” 表示检索词出现在同一个句子中. (5) field 运算符为“(f)” 表示两个词必须出现在同一字段内. * Example 1 Health(s)environment? Recently environmental control is regarded as important for good human health conditions and toxic substances, i

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档