Olap模型设计指南.docx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

Olap模型设计指南

作者

作者

林志贤

状态

创立

时间

2023-3-21

说明

初稿

摘要:本指南具体介绍OLAP立方体构造,几种维度模型,KingdeeOLAPSchema文档构造。通过学习和参考本指南,我们期望读者理解OLAP立方体构造,把握KingdeeOLAPCube模型构造和Schema文档构造,能否基于具体的业务设计出多维模型,满足汇总分析报表的开发。

OLAP立方体构造

立方体(Cube)

多维数据模型,是Olap分析的数据模型,由多个维度构造出的多维立方架构和度量值组成,多维度的交点,即立方体的单元格,对应一个度量值。多维运算的结果,是n维的超立方体。在数学上可对应一个多维数组〔维度1、维度2、维度3……维度n,度量〕。如以下图,该Cube有三个维度:产品、时间、工厂位置,单元格中的数字是度量,比方金额,这个Cube只有一个度量值,实际上Cube可能有多个度量值。

图1立方体构造

维度(Dimension)

是人们观看数据的特定角度,是考虑问题时的一类属性,属性集合构成一个维。例如:时间维、地理维等。维度具有层级构造,由多个级别组成,每个级别挂有多个成员,因此,一个维度构造是一个树状构造或称金字塔构造〔固然,假设只有一个级别,那就是扁平构造〕,每个节点带一个成员。维度水平布局由维度层次构造中具有一样级别的列值生成,而垂直布局由维度层次构造中具有不同级别的列值生成。

图2维度构造(工厂位置)

级别(Level)

人们观看数据的某个特定角度还可以存在细节程度不同的各个描述方面。例如:时间维可分为年、季度、月等3个级别。级别构成维度的层级构造,如上图工厂位置维度,由两个级别组成:东西部、州。

固然,不是说维度都必需具有几个级别,很多状况下只有一个级别。

可以定义这样一种特别的级别,即“全部”级别,处于最高级别。它只有一个成员“全部成员”,是全部成员的聚合值。

成员(Member)

表示维度的工程值,构成了维度的坐标。维的取值。是数据项在维中位置的描述。例如:“2023年3月28日”是在时间维上成员的描述。成员挂接在级别上,一个成员必需且只属于一个级别,比方工厂位置维度,从下至上有两个级别“州”、“东西部”,以及特别的“全部”级别,其中“州”级别上有以下成员:“缅因州”、“俄亥俄州”、“爱达荷州”,“得克萨斯州”,“东西部”级别上有“东部”、“西部”两个成员,“全部”级别上有一个成员“全部工厂位置”。

成员属性(MemberProperty)

表示成员的属性,每个成员可以有多个属性。最常见的属性有name、caption等,name属性可以用来查询,caption可以用来显示,依据业务需要,可以定义各种属性供分析使用。

度量值(Measure)

在多维数据集中,度量值是一组值,这些值基于多维数据集的事实数据表中的一列,而且通常为数字。此外,度量值是所分析的多维数据集的中心值。即,度量值是最终用户扫瞄多维数据集时重点查看的数字数据。不同维度在某一取值下的穿插点。例如:维度为2023

年1月,上海,笔记本电脑,度量值为$100000。

度量值表示分析指标,如销售额,销售数量,一个立方体包括一个或一个以上的度量值,全部度量值组成一个特别的维度,即度量维,度量维是扁平构造,其成员就是度量值,度量值本身是一个Member。假设Cube定义了两个度量值::销售额,销售数量,那么度量维包括一个特别级别,该级别挂了两个成员〔“销售额”,“销售数量”〕,度量维一般取名为“Measures”。

每个度量值必需定义一个聚拢函数〔Aggregator〕,聚拢函数表示在构造立方体数据时,度量值如何从低级别汇总到高级别。常见的聚拢函数包括:Sum〔求和〕,Max〔最大值〕,Min〔最小值〕,Avg〔平均值〕,Count〔计数〕。

度量值还可以定义格式字符串〔FormatString〕,表示该度量的精度,一般用于界面显示。

数据来源

多维数据集的数据来源由两个局部组成,一是构成维度的数据,二是事实发生的数据。一般称为维表和事实表。其中维表,包括维度的必要信息,如主键、name、caption等,事实表包括发生的事实数据,即度量字段,以及维度表关联字段。请参考图3。

图3数据来源

维度类型

全部多维数据集,最重要的就是维度构造。上面提过,维度从垂直布局看,是由多个级别组成,从水平布局看,是由成员组成。成员挂在级别上。这是维度根本的构造。但是,存在两种特别的维度。

时间维度:时间维度从本质上跟一般的维度没有什么差异,只是,时间序列分析是olap分析中最常用的功能,有很多特地针对时间维度的分析函数,而且,时间维度的级别是

文档评论(0)

180****1752 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档