大数据背景下读者借阅为的数据挖掘研究.pptVIP

大数据背景下读者借阅为的数据挖掘研究.ppt

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据背景下读者借阅为的数据挖掘研究

大数据背景下 读者借阅行为的数据挖掘研究 研究目的 : 在图书馆现有的数字化系统中,每时每刻都在产生着大量的统计数据和表单,如何以“大数据”为基础,把这些统计数据和表单在进行分析和处理后,其内在的信息量可以对图书馆的各种业务,尤其是采购、馆藏、咨询业务,起着很强的指导作用。 在图书馆数字化系统中采用各种数据挖掘技术,可以分析读者借阅行为信息资源的各项指标,例如图书馆藏资源的利用率、图书馆藏资源的有效率、图书馆藏资源的拒借率等指标,帮助图书馆加强采购、馆藏以及咨询等服务业务,能将被动的为读者提供图书资料,转变成主动地为读者提供可能感兴趣的信息资源,更好地为读者提供个性化的推荐服务。 研究过程: 1、数据挖掘应用于图书馆数字化系统的技术分析。 2、收集本校图书馆管理系统的后台数据,建立数据仓库,选取合适的数据挖掘分析工具。 3、运用数据挖掘技术,对读者借阅数据进行挖掘,分析读者行为习惯及特点,发现借阅行为中隐含的学科关联、借阅图书特点等。 4、数据挖掘技术在图书馆的读者借阅行为分析中的具体应用。 研究内容 : 随着图书馆读者的信息水平和信息要求的提高,也客观上要求图书馆能够为读者提供的信息服务能够更加主动和富于个性化,因此,图书馆要进一步加强对读者的借阅行为信息的处理和分析能力,并能够对读者借阅行为信息资源进行进一步组织和整合,从海量的表面上庞杂无序的读者借阅行为信息中提取有价值的内在联系供图书馆使用,满足读者新的更复杂的借阅需求。 数据挖掘(Data mining。DM),就是从大量的,不完全的,有噪声的,模糊的,随机的数据中,提取隐含在其中的,人们事先不知道的,但又是潜在的有用信息和知识的过程。数据挖掘常常也被称为数据库知识发现(Knowledge-Discovery from Databases,KDD),它可以从数据库或数据仓库以及其他各种数据库的大量各种类型数据中,自动抽取或发现有用的模式知识。 1.数据挖掘应用于图书馆数字化系统的技术分析 数据挖掘是对传统的需求分析技术进行提升后的新技术,应用在图书馆数字化系统中时,可以从图书馆数字化系统中所产生的海量历史数据中分析读者的需求,这是一种决策支持过程,支撑这种过程中可以应用到人工智能和统计学等技术,做到高度自动化地分析海量历史数据,从而,从海量历史数据中作出归纳性的推理,挖掘出潜在的读者借阅行为的模式,对今后的读者借阅行为进行预测,帮助图书馆的工作人员调整图书采购策略,进一步完善馆藏建设,加强图书信息咨询服务工作。 数据挖掘技术应用于图书馆的首要工作,是建立数据仓库。图书馆数字化系统中的业务数据很多,数据之间存在着复杂的横向联系,但大而化之,可以将数据仓库中所包含的信息分为主要的三类:读者信息、图书信息和读者借阅流通信息。 在构建数据仓库时,具体可以按以下步骤进行: 第一步,对图书馆各种业务数据进行数据建模,这是一个确定图书馆数据仓库主题的过程; 第二步,对所建的数据仓库的数据库进行设计,并确定数据转换的程序; 第三步,管理元数据。定义图书馆数据仓库的元数据,对图书馆各种业务数据进行元数据的表示、定义,确定其具体的意义,同时建立数据库系统中各组成部件的相互关系; 第四步,确定数据挖掘的数据分析工具,在实现和使用数据仓库的基础上,建立结构化的决策支持查询,帮助图书馆进行决策,实现图书馆决策支持需求。 在构建了图书馆的数据仓库后,就要开始进行数据挖掘体系结构的构建了。这个过程中可以分解为以下几个方面: 首先,将图书馆各种业务数据,包括读者基本信息、图书信息和流通信息,进行数据集成、数据过滤和数据转换,然后存储在数据库或数据仓库的服务器中; 然后,建立数据挖掘的工具引擎,调用数据挖掘的数据分析工具(例如Excel数据分析工具和OLAP数据分析工具),同时在知识库中存放数据挖掘算法(例如关联规则、聚类分析等算法),这是进行数据挖掘的核心过程。 最后是得出对图书馆各种业务数据挖掘结果,并向用户进行展示。图书馆各种业务数据通过前端开发工具调用后台建立的数据包进行数据挖掘的结果,其展示可以是表格、立方体,或者是其他模型,特点是直观、简明。 利用关联规则、聚类分析等算法,通过数据挖掘分析图书的实际利用情况。数据仓库中大量的这些读者信息、图书信息和读者借阅流通信息数据都属于结构化数据,对其进行数据挖掘的的算法很多,一般最常用的有两种:利用关联规则算法和利用聚类分析算法。 1)利用关联规则算法主要是侧重于借阅历史数据中的分析,通过对信息资源借阅历史进行关联规则算法的分析后,例如发现有大量读者在阅览A书同时也对B书进行了阅览,则图

文档评论(0)

181****7127 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档