- 1、本文档共157页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 信息检索理论与基本方法
第二章 信息检索的理论与基本方法 ;第一节 信息检索语言与检索途径 ;不同的检索系统由于所覆盖的学科领域不同,包含信息资源类型不同,通常采用不同的信息检索语言(例如期刊文献与专利文献所使用的分类语言);
同一个检索系统往往也同时采用多种检索语言,以形成多种检索途径和角度。(例如:中国知网)
;;二、分类 1、根据结构原理划分;(1)分类语言:用分类号和类名来表达信息的内容主题概念,并按知识门类的逻辑次序将信息资源系统地加以划分和组织的语言。其意义在于根据文献信息的内容特征和分类表,把相同内容的文献、信息集中在一起,同时又把不同内容的文献信息区别开来 ,以实现相关集中的功能。
分类语言的主要特点:按学科、专业集中相关文献信息,从知识分类的角度揭示文献信息之间的区别和联系,提供从学科专业领域检索???献信息的途径。;分类语言主要可分为等级体系型分类语言和分面组配型分类语言两种。
①等级体系型分类语言:是一种最传统的分类语言,是一个直接体现知识分类和概念逻辑的标识系统。所有类目按照学科专业的等级、层次划分,一一列举,构成一个由总体到个体,由一般到特殊,由全部到局部的分类标识体系。这种结构符合人们通常的研究思维习惯,能保证较高的查全率。
目前我国广泛采用《中国图书馆分类法》(简称《中图法》)进行分类,该分类法由5大部类、22个大类组成
;; I 文学 (《中图法》片断)
0 文学理论
1 世界文学
2 中国文学
21 作品集
22 诗歌、韵文
23 戏剧
24 小说
242 古代作品
246 五四以后作品
247 建国以后作品
.4 章回小说
.5 新体长篇、中篇小说
.7 新体短篇小说
.8 故事、微型小说 ;②分面组配型分类语言:在体系分类语言的基础上,吸收了概念分析与综合的方法而发展起来的。其分类标识可以进行灵活地组合,极大地提高了分类语言标引和检索能力。但在实际操作,灵活的组配往往较难在使用上达到很好的一致性,因此在传统信息检索的实际使用中并不多见。
如:文学类百科全书
I︰Z28 或者 Z28 ︰ I
;(2)主题语言:以主题词来表达信息主题概念的语言,它按事物对文献信息进行浓缩、描述和整序,借用自然语言的语词,作为文献信息和检索提问的内容标示。
特点:按特定的事物集中文献信息,有较强的直接性。
构成原理:利用自然语言中的名词术语,经过一定程度的规范化处理,作为表达文献和提问内容的主题词;利用参照系统中的各种手段,显示主题标识之间的各种关系,并以此把主题词表中的众多主题词相互联系起来,构成多维的主题词体系;利用主题词的字顺序列,按事物的名称来排列和检索文献信息。;①标题语言:采用规范化了的自然语言,即经过标准化处理的名词术语作为标识,来表达文献所论述或涉及的事物--主题,并将全部标识按字顺排列。
例:一篇文章用“微型计算机”这个术语来叙述它的研究对象,另一篇文章用“微型电脑”这个术语来叙述它的研究对象,第三篇文章用“微机”这个术语来叙述,虽然都表示同一概念,这时就不能直接用“微型电脑”或“微机”来作标题词了,这三篇文章都必须用“微型计算机”作标题词(根据词表决定)。因为这三个术语是等同概念,如果同时用三个术语来标引,便会导致文献被分散。当然,读者若从“微型电脑”或“微机”入手检索时,都可以在标题词表中看到“见:微型计算机”的参照指示。 ;;b. 多级标题:由于主标题与副标题组成。标题语言的主标题与副标题的搭配一般是固定的,其特点是直观、特指、先组、特别符合检索操作的要求,查准率高,但是灵活性不够。
例: 电子计算机
设计
制造
修理
例:前面例子中和两篇论文即可以集中在“电子计算机”这个标题词下,将与电子计算机相关的论文集中起来,又分别放在“电子计算机设计”、“电子计算机修理”中。
;主标题的构成方式有3种:
正叙式:用事物或过程名称直接以自然语言的正常词序作为主标题。
例:Air Pollution (空气污染)
并列式:将两
文档评论(0)