数据仓库与数据挖掘复习提纲.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
v1.0可编写可改正 数据库应用技术(数据库房与数据发掘复习纲要) 说明: 考试形式:闭卷 考试题型:填空、选择、判断、名词解说、简答题、综合题。(因为试题是随机从试题库中抽取,有可能抽取的试题中不会所有包含上述的所有题型) 此外:本纲要仅针对试题中的名词解说、简答题和综合题供给复习参照,不包含填空、选择、判断等其余题型的参照。 一:名词解说 数据库房、数据发掘、OLAP、ODS(操作数据储存) 二.简答题 1.试述数据库房系统与数据库系统的差别与相像之处。 2.试述数据库房设计的步骤以及每一步所达成的工作。 3.OLAP与OLTP的差别有哪些它们合适于运转在同一个服务器上吗为何 4.在数据发掘前,为何要对数据进行预办理,数据预办理的有哪些主要的处 理方法 5.在现实世界的数据中,元组在某些属性上缺乏值是常有的。描绘办理该问题 的各样方法。 什么是数据库房中的元数据,元数据包含哪些内容其重要性表此刻哪些方面 试述ODS在“DB-ODS-DW”系统构造中的作用。 请解说OLAP中维、维层次与维成员的观点,并举例说明。 数据库房中的数据是数据库中数据的简单聚积吗它有哪些常用的数据组织方 式 10.数据库房和数据市集的差别是什么数据库房的系统环境拥有什么特色有哪些 成立数据库房系统化环境的方法它们各有何好坏 数据库房的设计包含哪些内容 1 v1.0可编写可改正 在内容和使用者方面,数据库房环境中的元数据与操作型环境中的元数占有何异同 为了提升数据库房的性能,能够在哪些方面作一些努力在各个方面分别采纳什么样的技术这些技术易于实现吗 供给哪些基本操作 服务器有哪些实现方法它们的好坏是什么 为何不可以依赖传统的业务办理系统进行决议剖析 自然演化系统构造中存在的问题 试述成立多维数据库的过程。 19.数据发掘的主要方法。 数据发掘中的数据分类是个两步的过程,简述每步过程。 关于类特色化,鉴于数据立方体的实现与诸如面向属性概括的关系实现之间的主要不一样是什么议论哪一种方法最有效,在什么条件下最有效。 一般来说,数据库房采纳什么样的数据模型与OLTP的数据库模型对比,这些模型有什么特色 三.综合题 第一类:给定一个表的构造及数据,计算每个决议属性的信息增益(请同学们掌握该方法,不一样的试题中给定的表构造及数据是不一样的) 例一:假定有以下的“雇员基本信息”表的构造及数据,此中属性“薪资”为类型表记属性,属性“部门”、“职位”、“年纪”作为决议属性集。 第一种出题形式:请计算每个决议属性“部门”、“职位”、“年纪”的信息增益。 第二种出题形式:成立决议树,并产生IF-THEN规则。 (此外请同学们自己复习课上所讲的例子),。 部门*职位*年纪*薪资 销售部高级31—4041K—55KC2 2 v1.0可编写可改正 销售部 初级 21—30 26K—40KC3 销售部 初级 31—40 26K—40KC3 系统部 初级 21—30 41K—55KC2 系统部 高级 31—40 56K—70KC1 系统部 初级 21—30 41K—55KC2 系统部 高级 41—50 56K—70KC1 市场部 高级 31—40 41K—55KC2 市场部 初级 31—40 41K—55KC2 秘书处 高级 41—50 26K—40KC3 秘书处 初级 21—30 26K—40KC3 第二类:利用Apriori算法找寻事务集中的屡次项集,并由找到的屡次项集产生强关系规则。(请同学们掌握该方法,不一样的试题中给定的事务集是不一样的) 例一:假定现有以下表所示的一个事务数据库,数据库中有10个事务,即|D|=10。假定最小支持度minsup=20%,最小置信度minsup=65%,利用Apriori算法找寻D中的屡次项集,并由找到的屡次项集产生强关系规则。(此外请同学们自己复 习课上所讲的例子) TID 项列表 T1 I1 ,I2,I5 T2 I1 ,I2 T3 I2 ,I4 T4 I1 ,I2,I4 T5 I1 ,I3 T6 I1,I2 ,I3,I5 T7 I1 ,I2,I3 T8 I2 ,I5 3 v1.0可编写可改正 T9 I2,I3,I4 T10 I3,I4 第三类:利用简单贝叶斯分类对数据进行分类(请同学们掌握该方法,不一样的试题中给定的表构造及数据是不一样的) 例一:假定有以下的“雇员基本信息”表的构造及数据,此中属性“薪资”为类 别表记属性,类型表记有3个取值(C1、C2、C3),属性“部门”、“职位”、“年纪”作为决议属性集,请利用贝叶斯简单分类方法对未知数据: X=(部门=‘系统部’,职位=‘高级’年纪=‘2130’)进行分类。(此外请同学 们自己复习课上所讲的例子) 部门* 职位* 年纪* 薪资 销售部 高级 31—40 41K—55KC2 销售部

文档评论(0)

198****3683 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档