- 1、本文档共134页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
03文献信息检索-第三章
课题相关性 系统相关性 相 关 文 献 无 关 文 献 总 计 检出文献 a(命中的) b(误检的) a+b 未检出文献 c(漏检的) d(应拒的) c+d 总 计 a+c b+d a+b+c+d 分析上表,检出文献(a+b,即从系统中检索出来的文献)以及未检出文献(c+d,即未从系统中检索出来的文献)是从系统相关性观察检索的效率。而相关文献(a+c,即与用户需求相符的文献)以及无关文献(b+d,即与用户需求不相符的文献)是从用户相关性观察检索的效率。任何一次检索结果都必然有这四个量,根据上述表中四种关系,我们可以对查全率和查准率进行定义和计算推导。 查全率(recall ratio)是指检出的相关文献数与库内相关文献总数之比,又称“检全率”、“命中率”,可用下式表示: 查全率= X 100% 即查全率: R= X 100% ? 查准率(precision ratio)是指检出的相关文献数与检出的文献总数之比,又称“检准率”、“相关率”,可用下式表示: 查准率= X 100% 即查准率: P= X 100% 例:数据库共存储了45000条信息,某个读者通过检索,检索出600篇 文献,其中符合要求的有300篇,而数据库中还有符合要求的100篇论文 没有被检索出来,请计算他的查全率和查准率? 解:已知:a+b+c+d=45000; a+b=600; a=300; b=300; c=100 查全率: R=a/a+c=300/300+100=300/400=3/4=0.75=75% 查准率: p=a/a+b=300/300+300=300/600=3/6=0.50=50% 答:该项目的查全率为75%,其查准率为50%。 对查全率R和查准率P两个公式作下图,可以看出两者之间存在互逆关系。 20 40 50 90 40 60 70 90 P R A C D B 查准率 查全率 查全率(R)和查准率(P)关系曲线图 本章思考题: 1、试述文献信息检索的原理? 2、文献信息检索语言的定义是什么? 3、简述信息检索语言的种类? 4、简述国内主要分类语言的体系结构? 5、检索工具必须具备的五个条件是什么? 6、按文献信息的著录形式划分,检索工具有哪些类型? 7、文献信息检索的途径是什么? 8、文献信息检索的方法是什么? 9、文献信息检索的步骤是什么? 10、数据库共存储了45000条信息,某个读者通过检索,检索出600篇文献,其中符合要求的有300篇,而数据库中还有符合要求的100篇论文没有被检索出来,请计算他的查准率和查全率? * 《海天华教中文期刊征订目录》 若要了解我国当前有多少报刊,哪些报刊与自己的专业有关,可查:《中国报刊名录》 《中国邮发报刊大全》等。 若要了解外国报刊进口情况,可以查中图进出口公司编印的《外国报刊目录》。 目录主要用于报道文献出版和收藏情况,通过查阅目录,我们可以了解到出版单位和收藏单位所拥有的文献情况。 以上介绍的都是综合性目录。各艺术门类的专科目录,接下来将按各艺术门类分别介绍。 (2)题录(bibliographic citation) 题录以内容上独立的单篇文献或书中一部分以 致整个出版物作为其著录和报道单位(按“篇”报道 文献),也只对文献外表特征的描述。 题录通常包括:作者(或含其所在单位)、篇 名和来源出处及文种等,由出处导向原文 题录报道 周期较短,收录范围大,著录较为简单,但没有内容 摘要。 题录的著录格式 中国数控机床的现状及发展趋势/郝安林(安阳大学).——安阳大学学报:综合版,2004(2);21~23。 浅谈数控机床选购时应注意的事项/常正军(兰州理工大学机械厂).——甘肃科技,2004(5);90。 装夹方法——电控永磁夹具/李黎(意大利泰磁公司中国区).——航空制造技术,2004(7);42~43。 注意:题录经常以篇名目录(与目录形式相似)或篇名索引
文档评论(0)