Internet 信息资源检索.pptVIP

  1. 1、本文档共102页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Internet信息资源检索ppt课件

Internet 信息资源检索 搜索引擎知识讲座 1993年互连网上出现了第一个Web浏览器叫Mosaic 1994年Netscape公司推出了Navigator 浏览器的发展促使Web得到迅速推广 1994年7月,第一个真正意义上的现代搜索引擎诞生,它的名字叫Yahoo,创始人是美籍华人杨致远 搜索引擎的分类 按检索机制分 全文搜索引擎 目录搜索引擎 元搜索引擎 按搜索的内容分 综合性搜索引擎 专门搜索引擎 全文搜索引擎 基于机器人(robot)程序也叫蜘蛛程序(spider)提取站点上的网页 索引器为搜集到的信息建立索引 检索器按输入检索词检索索引库并返回结果 优点: 信息量大、更新及时、毋需人工干预 缺点: 返回信息过多,有很多无关信息,需要用户进行筛选。 典型全文搜索引擎 国外 Google 02 Alltheweb Excite、Inktomi、Lycos 国内 百度 雅虎中国 典型全文搜索引擎 1)国外: (1)Google Google是由两位斯坦福大学的博士生 Larry Page 和 Sergey Brin 在 1998 年创立的。可以说是目前世界上最大最全的搜索引擎,在搜索引擎市场上居龙头宝座地位。 目前已经收集了超过30亿的网页,而且检索速度快,功能强大。现在,Google 每天需要提供 1.5 亿次查询服务,而且每条搜索所用时间通常不到半秒。 网易使用的是Google的网页搜索服务。 大多数的搜索引擎依靠少量大型服务器,这样,在访问高峰期速度就会减慢,而 Google 却利用相互链接的 PC 来快速查找每个搜索的答案。 这一创新技术成功地缩短了响应时间,提高了可扩展性,并降低了成本。这也是其他公司一直在效仿的技术。 网站排名 Google检索到的网站排名是按照网站的被链接数量由高到低排列,不存在人为的干预因素。因此最先出现的往往都是质量较高的网站。 PageRank 技术:通过对由超过 50,000 万个变量和 20 亿个词汇组成的方程进行计算,PageRank 能够对网页的重要性做出客观的评价。PageRank 并不计算直接链接的数量,而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的投票数量来评估该页的重要性。 此外,PageRank 还会评估每个投票网页的重要性,因为某些网页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值。重要网页获得的 PageRank(网页排名)较高,从而显示在搜索结果的顶部。Google 技术使用网上反馈的综合信息来确定某个网页的重要性。搜索结果没有人工干预或操纵,这也是为什么 Google 会成为一个广受用户信赖、不受付费排名影响且公正客观的信息来源。 主要功能 手气不错 按下“手气不错”按钮将自动进入 Google 查询到的第一个网页。您将完全看不到其它的搜索结果。如:输入中央电视台,会直接转到中央电视台的网站。 网页快照 Google 在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。单击“网页快照”时,您将看到 Google 将该网页编入索引时的页面。Google 依据这些快照来分析网页是否符合您的需求。 在显示网页快照时,其顶部有一个标题,用来提醒您这不是实际的网页。符合搜索条件的词语在网页快照上突出显示,便于您快速查找所需的相关资料。 尚未编入索引的网站没有“网页快照”,另外,如果网站的所有者要求 Google 删除其快照,这些网站也没有“网页快照”。 自动使用“and”进行查询 Google 只会返回那些符合您的全部查询条件的网页。不需要在关键词之间加上“and”或“+”。如果您想缩小搜索范围,只需输入更多的关键词,只要在关键词中间留空格就行了。 主要功能 逻辑或用OR(大写的) 分别输入“鲁迅 or 周树人”和“鲁迅 OR 周树人”,所得到结果数量完全不同,因为前者要求网页中必须同时有“搜索引擎”和“历史”两个关键字,而后者则只要求其中之一就满足条件了,当然出现的结果数量差异就比较突出 类似网页 如果您对某一网站的内容很感兴趣,但又嫌资料不够,Google 会帮您找到其他与此网页网址相关的类似资料的网站。 按链接搜索 有一些词后面加上冒号对 Google 具有特殊的含义。其中的一个词是“link:”。例如,“link:”将找出所有指向大连理工大学图书馆主页的网页。不能将 link: 搜索与普通关键词搜索结合使用。 指定网域 要在某个特定的域或站点中进行搜索,可以在 Google 搜索框中输入“site:”。 例如,要在大连理工大学 站点上查找“

文档评论(0)

118zhuanqian + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档