信息检索原理与技术.ppt

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
检索举例 查找我馆馆藏中“英语”方面的2000年以来出版的图书的藏书情况 / 二、检索语言的分类 自然语言  从信息内容本身自动抽取的。如题名、著者、号码、关键词、文摘、作者所在机构等。 题名语言是按文献题名顺逐字排检。 著者语言是按著者姓名,按姓前名后的字顺逐字排检。 号码语言是按文献代码,如专利号、标准号,报告号,ISBN号等的顺序排检。 人工语言  根据检索的需要由人工规定的,采用规范词或代码来专指某个概念或网罗与之相应的概念。可以将同义词、近义词、相关词、多义词及缩略词规范在一起,由人工控制,包括分类检索语言和主题检索语言。 1、分类语言 分类语言是以号码为基本字符,用分类号来表达各种概念,将各种概念按学科性质进行分类和系统排列。 按照学科范畴及知识之间的关系列出类目,并用数字、字母符号对类目进行标识的一种语言体系,也称分类法。 分类法产生得最早、用得最多的是图书分类法。 目前常用的分类法有《中国图书馆图书分类法》(简称中图法)、《美国国会图书馆分类法》、《杜威分类法》、《国际专利分类表》、中国科学院图书馆图书分类法-简称科图法、国际十进分类法-UDC。 《中国图书馆图书分类法》 1999年推出了第四版,共分5大部类22个基本大类。22个基本大类是在5大部类的基础上第一次划分得到的,称为一级类目,分别对应一个英文字母。  从基本大类起,再连续划分3次,得到二级、三级、四级类目。   采用汉语拼音字母和数字相结合的方式对图书进行分类,是目前国内各公共图书馆和高校图书馆普遍使用的图书分类法,我馆藏书也是按照该分类法进行排架。 中图法简表 中国图书馆分类法样例 索书号举例 F123.16/W61 索书号/排架号 无机化学 分类语言用于检索信息的特点 具有等级结构,便于缩小检索范围; 用分类号做检索标识,不存在文种的限制; 分类表中的类目不能随时变化,不能及时反应新的学科技术,边缘交叉学科只能从学科门类进行检索; 隶属于一个门类下,造成漏检。 2.主题检索语言 主题语言是一种选自自然语言直接性的检索语言,使用词语标识主题语言实际上是相对于分类语言的一切以主题字顺体系为基本结构的检索语言总称。 由主题词汇构成,即将自然语言中的名词术语经过规范化后直接作为信息标识,揭示主题概念之间的关系。 主题语言表达的概念比较准确,具有专指性,不同的专业领域或不同的数据库(一般为外文数据库)有自己的主题词表。 主题语言的优点: 直接性好 专业性强 灵活性高 主题语言的缺点: 有时一个课题可能涉及多个主题,不利于从学科角度检索文献。 EI中的词表功能 (3) 制订优化的检索策略 尽量准确地表达检索要求,合理调整查全率和查准率。由于查全率和查准率是互逆的,所以,需要根据课题的具体要求,来合理调整两者的比例关系。 如?需了解某项研究的情况则要求查全率高,如需了解某项研究的最新进展,则要求查准率高。总之,选用泛指的检索词,或尽可能增加与检索主题概念相关的检索词的数量,则查全率就高;选用专指性的检索词或由若干个检索词组配的专指概念的检索词,则查准率就高。 (4)制定检索策略可供参考的意见 要正确处理检索手段与检索目标的关系。制定检索策略,必须以能实现检索目标为前提条件。 文献检索的特点,一般来说,具有检索目的的唯一性,检索手段的随机性。实现同一检索目的,往往具有几种不同的检索方法和途径,应从中优化出一种最省时、省力的最佳方案。 (5) 要广开思路 除了利用检索工具书外,还应注意直接利用普通书刊,特别是丛书、丛刊、文集、资料汇编、方志之类的书刊,这对查找专题资料说,往往能迅速达到检索目的,甚至可以起到事半功倍的作用。 下次课程安排 图书馆2楼报刊处领取实验报告 思考题 1.简述文献检索原理。 2.检索语言分哪两大类?分别叙述各种检索语言排检方法。 3.文献检索有哪些途径? 4.逻辑运算符中的逻辑“与”、逻辑“或”、逻辑“非”分别用于何种情况下的概念组配? * 手工信息检索优点:简单、灵活、无检索费用。 脱机批处理信息检索同时进行多项检索,一次输入,产生多种输出;不能人机对话和浏览文献;不能修改策略;获取结果不及时;结果有误差。 联机信息检索特点:同时检索多个数据库、远程、同步、及时修改策略;及时显示、浏览文献;数据质量高、检索机与主机是主仆关系、对检索人员要求高、而且检索需要的费用高。 光盘信息检索分为单机检索和局域网内的联机光盘检索。 网络信息检索特点:数据库分布式存储,数量多,信息量大;由 于超文本语传输协议,提供了大量相关链接;内容向多媒体发展,不仅有文本,还有图

文档评论(0)

1112111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档