数字资源收割工作发展.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字资源收割工作发展

数字资源收割工作发展   [摘要]介绍各国数字资源收割技术的发展,如挪威、新加坡、丹麦等从法律上明确公共图书馆对数字资源进行收割和保存的职责;日本、韩国、美国等都各自开发有对网络资源爬行和抓取的工具软件。并着重论述新西兰国家图书馆与英国不列颠图书馆合作开发Web CuratorTool,在收割质量保障、保存格式、授权管理等方面优点明显,但在图像资源收割及大规模任务执行等方面还存在不足。   [关键词]数字资源长期保存 数字资源收割   [分类号]G253      1 数字资源收割工作的现状      当今的数字资源将成为未来的科学史、文化史、社会史。正如我们从印刷资源中追溯文明一样,后代将从被保存的数字资源中回顾和利用我们所创造的知识,让人类可持续发展。数字资源长期保存工作的意义不言而喻。   数字资源收割是数字资源长期保存的第一步,近年来,各国的数字资源的收割工作在制度、机构和工具等各方面都有了长足的发展。      1.1 数字资源收割的相关制度   挪威于1990年生效的《保存本法》所规定的国家图书馆收割和保存范围涵盖了网络电子出版物,并提供了具体实施规章。   新加坡于1995年通过了“新加坡国家图书馆管理局法案”(NLB Act),规定在法定的呈缴框架下,电子或联机形式传播的出版物不论是否已通过网页内容收割和存档,都须向管理局呈缴两份复本。   丹麦于2000年出台的第340号法案规定了公共图书馆收割、保存和提供包括因特网与多媒体在内的电子信息的职能。   澳大利亚联邦于2006年修正的著作权法案(Amendments t0 the Copyright Act)第40条和41条,对图书馆的数字收割和保存活动给予了重视与支持。   英国国家图书馆正建议国家立法,不限制数字资源的自动获取,支持以保存为目的缴送和复制,并涵盖有可能增加的各种介质出版物。   德国的国家存档项目Nestor正建议修改《呈缴本法》,要求法律支持数字资源副本的创建和修改权,取消由DRM提出的限。      1.2 数字资源收割的执行机构   目前进行数字资源收割和保存的执行机构主要是各国的国家图书馆,但除此之外,许多政府、文化与科研???构及联盟也成为了重要力量。   澳大利亚的PANDORA项目以国家图书馆为核心,参与机构包括国家声像档案馆、战争纪念馆、原住民及托雷斯海峡居民研究协会、澳大利亚可持续知识仓储伙伴计划(APSR)中的联盟成员等。   德国国家图书馆组建了数字资源长期保存专业技术网,参与的组织除几所大学图书馆外还包括柏林博物馆信息协会和巴伐利亚州档案馆。   互联网档案组织(Internet Archive,IA)由美国国会图书馆和Smithsonian组织共同构成,以为后代保存稍纵即逝的、具有历史性重大意义的“原生”互联网资源为目的。   澳大利亚、加拿大、丹麦、芬兰、法国、冰岛、意大利、挪威、瑞典等国的国家图书馆,英国不列颠图书馆,美国国会图书馆和IA等机构共同建立了国际网络资源保存社团(International Internct Preservation Consorti―um,IIPC),鼓励和支持利用通用工具、技术与标准建设国际档案馆(international archives),并资助相关研究项目。      1.3 数字资源收割的工具   2006年,在WARP项目(Web Archiving Project)中,日本国会图书馆开发了一个须版权人授权的网页爬行机器人进行网络资源收割。主要收割对象是网站,其次是在线期刊和城镇农村信息资源。   2008年,韩国国家图书馆在OASIS计划(Online ArchivingSearching Internet Sources)中进行网络数字资源的收割和保存。目前的收割对象主要为两类:网站和其他单独网页数字资源。   新加坡国家图书馆管理局从2006年开始启动了收割互联网中所有与新加坡有关的网页内容计划。2007年,该局建设并使用了一个自助提交系统,出版者可以在网络上直接提交数字出版物。   澳大利亚PANDORA项目开发了PANDAS系统,与IA协作进行大规模地域收割活动,已完成两次大规模的资源“爬行”,主要抓取采用.au顶级域名的网页资源。   2006年,美国国会图书馆开通了直接隶属于国家数字信息基础设施和保存计划(NDIIPP)的网页抓取项目,使用IA专门设计的开发源代码爬虫软件Heri―trix进行网页收割。      2 新西兰的数字资源收割工作      2.1 相关制度和机构   新西兰于1965年出台了136号法令――《新西兰国家图书馆法》,并在1971―2003年间进行了多次补充和

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档