基于Hadoop数据系统数字档案馆信息服务模式研究.docVIP

基于Hadoop数据系统数字档案馆信息服务模式研究.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Hadoop数据系统数字档案馆信息服务模式研究

基于Hadoop数据系统数字档案馆信息服务模式研究   摘 要:随着数字化档案馆技术应用研究的开展,Hadoop信息技术在档案馆信息服务中得到了广泛应用。本文结合Hadoop技术特征,开展了其对数字档案服务影响、新型服务模式建立支持以及应注意的主要问题研究,为这一技术应用发展提供技术理论支持。   关键词:Hadoop;数字档案馆 信息服务模式   随着大数据云技术时代的来临,利用新型数据处理技?g促进档案管理数字化建设,进而为数字化档案馆建设提供技术支持就成为了档案数字技术研究的重要组成部分。在这一过程中,Hadoop得以在大数据处理以及云平台应用优势,在当前的数字化档案馆建设中得到了广泛应用。因此技术人员开展了Hadoop数据系统技术支持下的的数字档案馆信息服务研究,并将其定为2016年海南省哲学社会科学规划课题“基于分布式系统的档案资源集成平台模式研究”[项目编号:HNSK(ZC)16-47]的成果之一,进而为我国数字化档案建设提供支持。   1 Hadoop数据系统对数字档案馆信息服务影响研究   Hadoop在应用中可以对大量数据进行分布式处理,在使用中具有一种可靠、高效、可伸缩的处理优势。因此在这一技术支持下,传统的数字档案馆信息服务模式也受到了较大影响。这种影响是在Hadoop大数据与云平台技术支持下产生的。   1.1 促进服务理念转变   建设服务主导型数字档案馆,是未来数字档案馆发展的必然方向,也是大数据时代档案馆发展的主要特征。而在这一转变过程中,Hadoop数据系统是一种集技术、服务于一体的技术服务手段。在大数据支持下,系统将传统的逻辑分析处理方式,逐渐转变为大数据挖掘收集、数据量化与相互关系分析过程,进而提出优化服务方案的服务模式。这种服务理念的的转变在大数据技术支持下,可以有效提高数字档案馆信息服务质量与效率。   1.2 拓宽数据化信息资源   档案馆馆藏信息资料是数字化档案馆服务运行的基础。随着大数据技术的发展,数字化档案馆的存储量已经可以达到PB级。而在实际应用中,Hadoop的框架最核主要包括了HDFS和MapReduce,两个主要组成部分。其中HDFS就是海量数据存储技术,可以为PB级数据储存提供支持。这种储存规模的扩大,在数字档案馆应用中可以发挥以下两方面作用:一方面海量储存功能作用的发挥,确保了馆藏信息资料存储量的提升;另一方面也是其与云平台服务提供了衔接。   1.3 为信息服务提供高效技术支持   在大数据时代数字化档案馆技术发展中,技术管理者使用Hadoop信息技术,有效的提高了档案馆技术水平。这种技术的水平的提高包括了以下两个主要部分。(1)分析处理技术的转变。在传统数字化档案时代,由于数据处理能力较低,因此处理装置会采用抽样分析方式,处理数字化信息,其分析与处理能力受到严重制约。而在Hadoop技术支持下的新型数字化档案管理中,其分析方式已经向整体分析处理方式转变,进而提高了数字化系信息服务的完整性、准确性与深入性,进而实现了档案管理的数据科学目标。(2)非结构化数字信息模式的形成。随着档案馆数据信息量的增加,非结构化数据已经成为了其数据信息的主要组成部分。而Hadoop技术就是一种对非结构信息进行分析处理,并最终根据统一标准进行存储的信息处理技术措施,进而有效的提高了档案分析服务质量与效率。   1.4 促进服务策略转变   Hadoop信息技术是一种基于大数据与云平台结合的信息化服务技术。因此这一技术应用的目标就是实现云平台网络档案服务战略的形成。这一战略包括了以下两个组成部分。(1)档案馆云平台服务策略。这一策略就是改变数字化档案馆原有的基础服务模式,而是通过云平台将其服务延伸至整个网络平台中,在信息安全许可条件下为社会群体、大数据挖掘等提供有效的档案服务工作。(2)形成数据挖掘下支持下的数字化档案馆。在云平台与大数据支持下,Hadoop可以将大数据挖掘出的信息数据融入自身数据库进行保存,利用智能化模式自行完善档案库数据信息。这种功能的形成将会是我国未来数字化档案馆服务能力提升与策略调整的主要方向。   2 Hadoop技术支持下的档案馆信息服务新型模式   在Hadoop信息技术支持下,我国的数字化档案馆在服务模式中已经有了较大转变,形成了一些新的服务模式。   2.1 一站式服务模式   在信息化时代,读者对于档案馆信息的需求是海量、高速而又专业化。因此档案馆数据信息要求是大数量、整合化的数据内容以及一站式信息服务模式。而在这一过程中,如何实现海量数据存储与分析整合,实现其数据库资源的高效共享也就成为了档案馆信息服务的核心技术。而在Hadoop技术中HDFS与MapReduce模块的结合,再通过Cloud Computing、GF

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档