数据仓库开发模型课件.pptVIP

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第二章数据仓库开发模型

v在创建数据仓库之时,需要使用各种数据模型对数据仓库进行描述。v数据仓库的开发人员依据这些数据模型,才能开发出一个满足用户需求的数据仓库。v使开发人员能够将注意力集中在数据仓库开发的主要部分。v模型有更好的适应性,更易于修改。v当用户的需求改变时,仅对模型做出相应的变化就能反映这个改变。

目录v2.1数据仓库开发模型v2.2数据仓库概念模型v2.3数据仓库逻辑模型v2.4数据仓库的物理模型v2.5数据仓库的元数据模型v2.6数据仓库的粒度和聚集模型

2.1数据仓库开发模型

v模型是对现实世界进行抽象的工具。v在信息管理中需要将现实世界的事物及其有关特征转换为信息世界的数据才能对信息进行处理与管理,这就需要依靠数据模型作为这种转换的桥梁。v这种转换一般需要经历从现实到概念模型,从概念模型到逻辑模型,从逻辑模型到物理模型的转换过程。概念模型逻辑模型物理模型数据仓库的开发过程

v四个世界三级抽象现实世界概念世界逻辑世界计算机世界列(字段、数据项)信用特性属性张三客户个体整体实体记录同质总体异质总体表文件数据库客户与产品整体间联系现实世界概念模型逻辑模型物理模型第一级抽象第二级抽象第三级抽象

v数据仓库的数据模型现实世界概念模型数据粒度和聚集模型元数据模型逻辑模型物理模型数据仓库v数据仓库的设计就是在概念模型、逻辑模型和物理模型的依次转换过程中实现的。作为数据仓库的灵魂——元数据模型则自始至终伴随着数据仓库的开发、实施与使用。数据粒度和聚集模型也在数据仓库的创建中发挥着指导的作用,指导着数据仓库的具体实现。

2.2数据仓库概念模型

2.2.1概念数据模型财务部门销售收入账应收账企业数据模型应付账成本账销售部门人事部门销售部门销售计划销售合同财务部门………销售统计……人事部门员工业绩记录员工技能情况员工薪酬表企业数据模型

2.2.1概念数据模型v数据仓库概念模型的设计可以使用业务数据处理系统中的E-R图,但两者有一些差距。?数据仓库的数据模型中不包含操作型的数据,数据仓库的数据模型只包含用户所感兴趣的分析数据、描述数据和细节数据。?数据仓库的数据模型扩充了关键字结构,增加了时间属性作为关键字的一部分。?数据仓库的数据模型中还增加了一些由基本数据所导出的衍生数据,这些导出的衍生数据主要用于对企业的管理决策进行分析。

2.2.1概念数据模型v数据传统的E-R图不能直接用于数据仓库的概念模型的设计,只能对其中的元素作修改后使用。v将实体分成:指标实体(事实实体)、维度实体和详细类别实体(引用实体)。

维度实体名详细类别实体名指标实体名指标实体(事实实体)维度实体详细类别实体(引用实体)v指标实体:现实世界中的业务处理或某一事件的逻辑表示。是数据仓库中的实体表。对指标实体数据的管理是数据仓库管理的重点。v维度实体:可以形成一个维度体系,具备访问和过滤指标实体的能力。是数据仓库中的较小的表。v详细类别实体:与现实世界中的某一个实体相对应。它具有终止操作的作用。v用户通过维度实体得到指标实体数据,而在操作到详细类别实体时停止操作。

2.2.2规范的数据模型数据仓库的数据普通数据库系统的数据长期的框架静态短期的框架快速变化数据通常是汇总的特殊查询访问定期更新记录级的访问标准查询访问实时更新数据驱动事件驱动v第一范式、第二范式、第三范式数据仓库的反规范化处理,将小表合并,以减少多表查询时的表的连接操作。

2.2.2规范的数据模型v数据仓库中的各个实体不是对等的,在建立实体时,需要根据载入数据实体的数据量来考虑数据仓库中数据的结构设计。

2.2.3星型模型维度表事实表维度表维度表维度表维度表v星型模型是最常用的数据仓库设计结构的实现模式。使数据仓库形成了一个集成系统,为用户提供分析服务对象。v核心是事实表,围绕事实表的是维度表。通过事实表将各种不同的维度表连接起来,各个维度表都连接到中央事实表。

2.2.3星型模型v事实表:包含主题。维度表:包含事实的非正规化描述。v星型模型可以采用关系型数据库结构。维度表中的对象通过事实表与另一维度表中的对象相关。通过事实表将多个维度表进行关联,就能建立各个维度表对象之间的联系。v每一个维度表通过一个主键与事实表进行连接。维度表利用维度关键字通过事实表中的外键约束于事实表中的某一行。事实表中的外键不得为空。

2.2.4雪花模型维度表维度表事实表详细类别表维度表维度表维度表详细类别表v星雪花模型是对星型模型的扩展,每一个维度都可以向外连接到多个详细类别表。v雪花模型对星型模型的维度表进一步标准化,对星型模型中的维度表进行了规范化处理。

2.3数据仓库逻辑模型

v逻辑模型亦称为中间层数据模型,它是对高层概念模型的细分,在高层模型中所标

您可能关注的文档

文档评论(0)

138****9564 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档