- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
取信息的重要手段.因特网是一个信息的海洋,如何在这个浩
全文搜索引擎 目录式搜索引擎 信息检索工具工作原理: 1、全文搜索引擎的工作原理 关键字 提炼搜索关键词(提炼最具代表性和指示性的关键词) 细化搜索条件(如多输入一两个关键词) 用好逻辑符号(and、or、not) 强制搜索(添加英文双引号来搜索短语词) 目录索引类搜索引擎一般采用人工方式采集的存储网络信息,依靠手工为每个网站确定 一个标题,并给出大概的描述,建立关键字索引,将其放入相应的类目体系中。 搜索引擎的发展趋势 题问365试题搜索引擎 其他信息检索工具: 以FTP 、Telnet 、Usenet等资源为检索对象的检索工具,如:北大天网、Archie等 下面以“北大天网”为例。 :8080/ 元搜索引擎: 元搜索引擎是一种调用其他多个独立搜索引擎的引擎,是对多个独立搜索引擎的整合、调用、控制和优化,能方便地检索多个搜索引擎,扩大检索范围,提高检索的全面性。如: 元搜索引擎的特点 元搜索引擎在搜索的时候,用户只需提交一次搜索请求,而且可以同时搜索多个数据库,并根据多个搜索引擎的检索结果进行二次加工,如对检索结果进行重排和标明检索结果来源等,输出给用户。 利用困特网进行信息资源检索时,如果想大致了解某一个领域的信息资源,可以使用目录索引类搜索引擎;如果需要检索的信息资源目标比较明确,则可以根据信息资源的类型选择搜索工具。 * * 随着网络数字时代的到来,网络已成为人们获取信息的重要手段.因特网是一个信息的海洋,如何在这个浩瀚的海洋中迅速而准确地找到你想要的信息呢? §什么是搜索引擎? 它以一定的策略在因特网中搜集、发现信息; 它对信息进行理解、提取、组织和处理; 它为用户提供检索服务,从而起到信息导航的目的。 用代表所需信息的主题的关键字进行信息查询 利用罗列目录的方式引导搜索者依据目录查找需要的信息。 ---关键词检索 ---分类检索 常用全文搜索引擎: 7/ 常用目录索引类搜索引擎: 搜索器:负责定期地自动到各个网站上,把网页抓下来,并顺着上面的链接,持续不断地抓取网页。如“网络机器人”、“爬虫”、“蜘蛛”。 索引器:把搜索器抓来的网页进行分析,按照关键词句进行索引,并存入服务器的数据库中。 检索器:面向用户,接收用户提交的查询字串,在索引数据库中查询,并将结果反馈给用户。 1 2 3 §全文搜索引擎的工作原理 实例分析:你在“百度”搜索引擎中输入“北京概况”进行检索,结果出来后,有上万条信息,查看其中一项,就看到了相应的网页。(中国西部投资网/tzhj.asp?dq=11) Step1 “百度”的“蜘蛛”程序“爬”到了“中国西部投资网”上,抓到了“/tzhj.asp?dq=11”页面; Step2 从页面全文中抽取一系列关键字,包括“北京”、“概况”等等,并把网页网址与这些关键字关联,利用“索引器”建立网页索引数据库; Step3 当用户向“百度”提交了关键字,“百度”就利用“检索器”从索引数据库中搜索,并将搜索到的结果展示在页面上。 三个过程 : §全文搜索引擎的工作原理 “百度”的“蜘蛛”是如何知道有(中国西部投资网/tzhj.asp?dq=11)这个网页的呢? 1、“北京国际投资促进网”在“百度”的网站目录中注册过,“蜘蛛”顺着注册的地址找到其首页,并顺着首页找到“北京概况”这个特定页面。 两个可能 : 2、“蜘蛛”顺着其他网站上的“中国西部投资网”链接爬到了其首页上,并顺藤摸瓜,抓到了“北京概况”这个页面。 1、总目录 3、链接 2、专题目录 总目录——专题目录——链接——网站 §目录索引类搜索引擎的特点 从使用的角度讲,目录索引类搜索引擎最大的特点就是在查询信息时,事先可以没有特定的信息检索目标(关键词),通过浏览主题了解某一主题的相关资源。 而且,目录索引类搜索引擎的网页由人工精选,网页内容丰富,学术性较强。 §目录索引类搜索引擎的不足 因特网上的信息量大,信息资源不断增加、复杂多变,人工分类具有一定的主观性; 同时,由于人工编制和维护要花费大量的人力和时间, 因此,更新速度慢。 部分网络目录并不全是人工方式采集和组织信息,而是利用自动功能或者由用户递交的方式来丰富和补充资源。 由于目录索引类搜索引擎与全文搜索引擎检索有各自的优点和缺点,目前它们谁也无法完全取代谁,于是很多搜索网站都同时提供这两种类型的服务,例如 Yahoo、Sina 等。 1、多媒体信息检索 传统的多媒体数据库中,除了文本和数字还包括图形、图象、声音、视频、动画等各种媒体组合。但多媒体信息具有丰富的内涵,如:图象的颜色、纹理、形状,动画中的运动、声
文档评论(0)