05.网络信息检索幻灯片.pptVIP

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
5 网络信息检索 概况 Internet网络上蕴藏着非常丰富的信息资源,从电子期刊、电子工具书、商业信息、新闻 、大学和专业机构介绍、软件、数据库、图书馆资源、国际组织和政府出版物,到娱乐性信息等等。它已经成为全球范围内传播科研、教育、商业和社会信息的最主要的渠道。但要从这个信息海洋中准确迅速地找到并获得自己所需的信息,却往往比较困难。正是为了解决这个问题,从20世纪80年代起人们就开发了各种网络信息检索工具。 检索工具 万维网检索工具主要检索万维网站点上的资源,它们常被称为搜索引擎、主题网关等,而且由于万维网资源常以网页的形式存在,它们的检索结果常常被称为网页。 非万维网检索工具主要检索特殊类型的信息资源,如Archie一检索FTP文件;Veronica一搜索Gopher服务器;WAIS-全文信息检索工具;Deja News-检索新闻组等。不过越来越多的万维网搜索引擎具备了检索非万维网资源的功能,使它们成为检索多类网络信息资源的集成化工具。 5.1 搜索引擎 概念 搜索引擎是一个为你提供信息检索服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。 搜索引擎的组成 1. 搜索器 2. 索引器 3.用户检索界面 运作过程 1.发现并搜集网页信息(robot、spider) 2.对信息进行提取并建立索引库 3.用户检索利用 搜索引擎的检索方式 目录浏览、 关键词检索 搜索引擎的分类 按索引方式分: 关键词搜索引擎:Google、Altavista、Excite、hotbot、一搜(yisou)、百度(baidu)、中国搜索(zhongsou)等; 目录式搜索引擎:Yahoo、Direct Hit、Britannica、常青藤等; B. 按检索内容分: 综合性的搜索引擎:infoseek、excite、yahoo等; 专业搜索引擎:专门收录某一方面、某一行业、某一主题的信息,如全球华人寻人引擎( )提供因特网上最强大的寻人功能,拥有一百万笔的中文姓名和E-mail资料。LIBClient-IRISWeb(法律信息)、MapBlast(地图)、Image Rover(图像)、eefind(中文图像)、Webcate等。 搜索引擎的检索特性 常用搜索引擎介绍及示例 Google》(中文) 网址: 概述 特点 检索功能 使用时应主意的问题 《Google》 概述 Google是由美国斯坦福大学的两位博士生拉里·佩吉和谢尔盖·布林于1998年创建的 其优势在于掌握的信息量以及检索模型和检索速度。它可为世界各地的用户提供适需的搜索结果,而且搜索时间通常不到半秒 Google采用全文标引方式,提供每日更新。现在,Google可以查询的网页达40多亿个,每天需要提供 1.5 亿次查询服务 《Google》 特点 支持多达132种语言 提供40多亿个搜索网页,涵盖内容齐全 搜索速度快 结果命中率高 搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介 智能化的“手气不错”功能,提供可能最符合要求的网页 “网页快照”功能,能从Google服务器里直接取出缓存的网页 《Google》 检索功能 基本检索:(布尔检索功能) 逻辑“与”:检索框中的两个关键词之间用空格隔开则默认为是“AND”(“与”运算)连接 逻辑“非”:用“—”(减号)表示,同时要求在减号前保留一个空格 逻辑“或”:用“OR”表示 双引号、连字号、斜线、问号、等号、省略号都可以作为短语的连接符号查找名言或专有名词 指定网域:利用site:可以在某个特定的网站或域中进行搜索 指定文件类型:filetype:文件类型,可以在一类文件中进行搜索,比如,filetype:pdf, filetype:ppt等 《Google》 检索功能 其它检索语法 搜索的关键词包含在URL链接中:inurl: 搜索的关键词包含在网页标题中:intitle: 搜索的关键词包含在网页的“锚”中:inanchor: 或allinanchor: 搜索所有链接到某个URL的网页:link: 《Google》 检索功能 高级检索功能 可以排除某个特定站点的网页(限定网域) 可以对检索结果页面的语言类型进行限制(限定语种) 可以限定检索结果的时间范围(更新日期) 可以限定关键词出现的位置(字词位置) 可以检索链向某一个网页的所有页面(键连功能) 可以检索与某一个网页相关的所有网页(相似网页检索) 《Google》 检索功能 图像检索 Google 分析页面上图像附近的文字、图像标题以及许多其它元素来确定图像的内容。Google 还使用复杂的算法来删除重复的内容,并确保在搜索结果中首先显示质量最好

文档评论(0)

lifang365 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档