- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
数据仓库与数据挖掘试题
《数据仓库与数据挖掘试题》
一、判断题(每小题1分,计30分,答题时每5个答案写在一起)1.数据库作为数据资源用于管理业务中的信息分析处理。(X)2.数据库的查询不是指对记录级数据的查询,而是指对分析要求的查询。(X)3.关系数据库是二维数据(平面),多维数据库是空间立体数据。(v)4.数据进入数据仓库之前,必须经过加工与集成。(V)
OLAP使用的是当前数据;OLTP使用的是历史数据。(V)
对数据仓库操作不明确,操作数据量少。(X)
数据集市实现难度超过数据仓库。(X)
OLAP使用的数据经常更新;OLTP使用的数据不更新,但周期性刷新。(X)9.数据集市可升级到完整的数据仓库。(V)
数据库中存放的数据基本上是保存当前综合数据。(X)
OLAP可以应分析人员的要求快速、灵活地进行大数据量的复杂处理。(V)
OLAP支持复杂的决策分析操作,侧重对分析人员和高层管理人员的决策支持。
(V)
OLTP的事务处理量大,处理内容比较简单但重复率高。(V)14.数据仓库的用户有两类:信息使用者和探索者。(V)
对数据库的操作比较明确,操作数据量大。(X)
数据库用于事务处理,数据仓库用于决策分析。(V)
信息使用者以一种可预测的、重发性的方式使用数据仓库平台。(V)18.
OLAP一次处理的数据量大;OLTP一次性处理的数据量小。(V)19.OLTP每次操作的数据量不大且多为当前的数据。(V)
20.数据仓库系统由数据仓库(DW)、仓库管理和分析工具三部分组成。(V)21.随着业务的变化,数据仓库中的数据会随时更新。(X)
数据集市的规模比数据仓库更大。(X)
数据集市具有更详细的、预先存储在数据仓库的数据。(V)24.不同维值的组合及其对应的度量值构成了不同的查询和分析。(V)25.OLAP使用细节性数据,OLTP使用综合性数据。(X)
数据集市由企业管理和维护。(X)
OLAP的概念模型是多维的。(V)
数据库已经成为了成熟的信息基础设施。(V)
数据库既保存过去的数据又保存当前的数据。(X)
1
OLTP面对的是事务处理操作人员和低层管理人员。(V)
二、填空题(每小题1分,计10分)
信息使用者通常查看概括数据或聚集数。
探索者的任务是寻找公司数据内隐含的价值。
数据立方体是在所有可能组合的维上进行分组聚集计算的总和。4.基本的多维数据分析操作包括切片切块、旋转、钻取等。5.数据立方体的构建和维护等计算方法成为了多维数据分析研究的关键问题。
OLAP是建立在网络上的开发体系结构。
在数据立方体中,不同维度组合构成了不同的子立方体。8.不同的数据仓库需要建立不同的数据库。
ETL是建立数据仓库的重要步骤,需要花费开发数据仓库70%的工作量。
数据仓库的数据是综合的集成。
三、名词解释(每小题5分,计30分)
1、 数据集市4、元数据
2、 数据挖掘5、知识发现
3、 商业智能6、数据仓库
1,数据集市(DataMarts)是一种更小、更集中的数据仓库,为公司提供分析商业数据的一条廉价途径。
DataMarts是指具有特定应用的数据仓库,主要针对某个应用或者具体部门级的应用,支持用户获得竞争优势或者找到进入新市场的具体解决方案。
4,元数据(metadata)定义为关于数据的数据(dataaboutdata),即元数据描述了数据仓库的数据和环境。
数据挖掘(DM):KDD过程中的一个特定步骤,它用专门算
法从数据中抽取知识。
商业智能以数据仓库为基础,通过联机分析处理和数据挖掘技术帮助企业领导者针对市场变化的环境,做出快速、准确的决策。
知识发现(KDD):从数据中发现有用知识的整个过程。
数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。
数据仓库研
究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成
性、稳定性和时
变性。
2
四、简答题(每小题5分,计30分)
简述数据仓库与数据挖掘的关系,
数据仓库与数据挖掘都是决策支持新技术。但它们有着完全不同的辅助决策方式。
在数据仓库系统的前端的分析工具中,数据挖掘是其中重要工具之一。它可以帮助决策用户挖掘数据仓库的数据中隐含的规律性。
比较统计学与数据挖掘的异同,
,统计学主要是对数量数据(数值)或连续值数据(如年龄、工资等),进
行数值计算(如初等运算)的定量分析,得到数量信息。
,数据挖掘主要对离散数据(如职称、病症等)进行定性分析(覆盖、归纳等),得到规则知识。
,统计学与数据挖掘是有区别的。但是,它们之间是相互补充的。
比较OLAP的数据模型MOLAP与ROLAP,
MOLAP是事先生成多维立方体,供以后查询分析用,而ROL
文档评论(0)