第三章节数据仓库系统的设计与开发.ppt

第三章节数据仓库系统的设计与开发.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章节数据仓库系统的设计与开发

数据仓库与数据挖掘 第3章 数据仓库系统的设计与开发 通过对数据仓库的概念、体系结构与存储结构、ETL过程等内容了解以后,如何建立数据仓库系统呢? 3.1 数据仓库系统的设计与开发概述 建立一个数据仓库系统的参考步骤 数据仓库系统的生命周期 创建数据仓库系统的两种思维模式 数据仓库数据库的设计步骤 建立一个数据仓库系统的参考步骤 数据仓库系统的建立是一个复杂而漫长的过程。涉及到: 源数据库系统 数据仓库对应的数据库系统 数据分析与报表工具 …… 数据仓库系统的生命开发周期 建立数据仓库系统的两种思维模式 自顶向下(Top-down) 将数据通过ETL汇集到数据仓库中,然后再把数据通过复制的方式存入各个数据集市中。 自底向上(Bottom-Up) 通过ETL将数据汇集到数据集市中,再将数据汇集到数据仓库中。 数据仓库数据库的设计步骤 3.2 基于SQL Server的数据仓库数据库设计过程详解 SQL Server 2005介绍 集成了三个服务。 SQL Server 2005的数据仓库架构 MS SQL Server 2005的数据仓库架构 利用星形图进行数据仓库的逻辑模型设计 根据分析需求与信息包图制作星形图 数据仓库的物理模型设计 物理模型设计的主要工作 物理存储结构设计的原则 数据仓库索引设计的特殊性 存储优化与存储策略 3.3 使用SQL Server 2005建立多维数据模型 SQL Server 2005示例数据仓库环境的配置与使用 基于SQL Server 2005示例数据库的多维数据模型的建立与应用 。 3.3 使用SQL Server 2005建立多维数据模型 在SQL Server 2005数据库环境中安装数据仓库组件、示例和工具 利用示例数据仓库(AdventureWorks DW)环境及帮助系统学习 3.3 使用SQL Server 2005建立多维数据模型 创建一个新的数据仓库分析项目 定义数据源 定义数据源视图 定义多维数据集 部署“销售分析示例”项目 浏览已部署的多维数据集 提高多维数据集的可用性和易用性 * * 建立一个数据仓库系统的参考步骤 收集和分析业务需求步骤 建立数据模型和数据仓库的物理设计 定义数据源 选择数据仓库技术和平台 从操作型数据库中抽取、清洗及转换数据到数据仓库 选择访问和报表工具,选择数据库连接软件,选择数据分析和数据展示软件 更新数据仓库 数据仓库系统的开发与设计是一个动态的反馈和循环过程。 一个数据仓库系统包括: 数据仓库数据库 数据分析应用系统 数据仓库系统的生命开发周期 3.2 基于SQL Server的数据仓库数据库设计过程详解 包括以下步骤: 分析组织的业务状况及数据源结构 组织需求调研,收集业务需求 采用信息包图法进行数据仓库的概念模型设计 利用星形图进行数据仓库的逻辑模型设计 数据仓库的物理模型设计 分析组织的业务状况及数据源结构 以SQL Server 2005实例数据库Adventure Works DW中所描述Adventure Works Cycles公司的用户需求为例。 公司概况 业务系统流程介绍 对数据源结构的分析与理解 组织需求调研,收集业务需求 坚持数据驱动+用户(需求)驱动的设计理体念,因此需要充分了解用户的需求,进而对需求进行分析。 关于用户需求的调研(确定主题域) 对用户需求调研结果的分析(确定度量指标和维度) 物理模型 星型、雪花模型 物理数据模型 概念模型 逻辑模型 面向用户的需求 细 化层次 更详细的 技术细节 信息包图 采用信息包图法进行概念模型设计 信息包图:是数据仓库的数据模型的第一层或最高层。由于大多数商务数据是多维的,但传统的数据模型表示三维以上的数据有一定困难。而信息包图简化了这一过程并且允许用户设计多维信息包并与开发者和其他用户建立联系。这种模型集中在用户对信息包的需要,信息包提供了分析人员思维模式的可视化表示。 信息包图法简介 工作: 确定系统边界:决策类型、需要的信息、原始信息 确定主题域及其内容:主题域的公共键码、联系、属性组 确定维度:如时间维、销售位置维、产品维、组别维等 确定类别:相应维的详细类别 确定指标和事实:用于进行分析的数值化信息 信息包图的建立 信息包: 维度 类别 空白信息包图样式 指标和事实 〖例〗试画出销售分析的信息包图。 解:首先根据销售分析的实际需求,确定信息包的维度、类别和指标与事实: (1)维度:包括日期维、区域维、产品维、客户维、广告维(待用)等。 (2)类别

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档