- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
维度建模指南.ppt
每个事实表的粒度是一个事件量测。用来描述数据或事件。事件可以发生,但是没有具体的测量值。 事故事件(FK) 位置(FK) 事故类型(FK) 事故当事人组(FK) 原告组(FK) 证人组(FK) 事故当事人组(FK) 事故当事人(FK) 事故角色 原告组(FK) 原告(FK) 原告角色 证人组(FK) 证人(FK) 证人角色 事故当事人PK) 属性.. 原告PK) 属性.. 证人(PK) 属性.. 1 确定每个事实表的粒度 2 确定维度的属性 3 确定维度的层次 4 确定每个事实所需要关联的维度 5 确定事实,包括预先计算的 6 确定缓慢变化维 确定详细数据的粒度级别 此过程必须是在建模之前最需要考虑的问题 比较典型的粒度指的是单独的,基于时间的或聚集在一个常用的维度的事务 去定是否需要同时存储编号和描述,或者只是编号,或者只是描述的信息 确定哪些字段的值需要被筛选掉或者需要存在 对于时间维度,我们需要确定的是年,季度,月,周,日等不同的层次 对于产品维度,我们需要确定的是产品大类,产品小类,产品等不同的层次 需要注意的是比如在销售中,地理位置的层次可能和真正的地理位置的层次会有不同 通常的维度包括时间,产品,投保人,代理人,和地理等常见对象 请注意,创建的维度需要和与其连接的事实的粒度保持一致 需要根据具体业务来确定事实及其量度 对于每个聚合事实需要在应用(ETL)过程中进行计算 根据需求,对缓慢变化维进行相应的处理 比如: 对于一个需求为不保留历史的客户维度,我们使用第一种类型的缓慢变化维来处理 对于一个需求为需要保留历史的产品维度,我们需要使用第二种类型的缓慢变化维来处理 在常规的数据流传递途径上,第三种方式不经常出现,相反,他们经常是一种ETL 团队成员间口头上执行决定 By Z.RaiNy 1.基础术语 2.维度建模中的三种模型 3.维度的类型 4.事实的类型 5.维度建模的一般过程 每个数据仓库都包含一个或者多个事实数据表。事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行 一般事实表中只存放数字或者一些Flag用来统计(Count),如收益、数量、支出等 销售事实 收益 数量 支出 毛利 … 维度表可以看作是用户来分析数据的窗口,维度表中包含事实数据表中事实记录的特性,有些特性提供描述性信息,有些特性指定如何汇总事实数据表数据,以便为分析者提供有用的信息,维度表包含帮助汇总数据的特性的层次结构。 客户维 时间维 商场维 产品维 销售事实 时间ID 客户ID 产品ID 商场ID 收益 数量 支出 毛利 … 粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别。细化程度越高,粒度级就越小;相反,细化程度越低,粒度级就越大。设计粒度是设计数据仓库中的一个重要的前提 层次指描述明细数据的层次 星形模型(Star Schema) 雪花模型(Snowflake Schema) 多维模型(Multi-dimension Schema) 数据或展现的安全性 复杂的查询和分析 事实被维度所包围,且维度没有被新的表连接 客户维 时间维 商场维 产品维 销售事实 时间ID 客户ID 产品ID 商场ID 收益 数量 支出 毛利 … 星形模型是一个比较折中的的建模方式(BI APPS中都是用的是星形的建模方式) 事实表被多个维表或一个或多个层次所包围 客户维 时间维 商场维 产品维 销售事实 时间ID 客户ID 产品ID 商场ID 收益 数量 支出 毛利 … 联系人维 联系人维 雪花模型一般在处理大的且相对静态的层次的时候使用 层次数据库,只有一个结构(立方体Cube)相当于一个多维数组。它包含了所有数据在各种级别的汇总 需要特定的多维数据库或者多维数据库引擎(Essbase)的支持 数据存储空间的问题:当新添加一个维度的时候,数据的量便会成指数增长 缓慢变化维(Slowly Changing Dimension) 快速变化维(Rapidly Changing Dimension) 大维(Huge Dimension)和迷你维(Mini-Dimension) 退化维(Degenerate Dimension) 大多数的维度的内容都会有不同程度的改变。比如: 雇员的升职 客户更改了他的名称或地址 我们如何去处理这些维度中的变化呢? 下面提供了三个处理缓慢变化维的方式 直接更新到原先记录中 标记记录有效时间的开始日期和结束日期,加入版本控制 在记录中添加一个字段来记录历史 客户Simmy将自己的地址由原先的Addr1改为Addr2。这时我们需要将这个记录了客户Simmy的记录中Address从Addr
文档评论(0)