- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 操作层数据只包含面向应用的原始数据,并且主要服务于高性能事务处理领域 数据仓库层存储不可更新的集成的原始历史数据,此外也存放一些导出数据 部门/数据集市层则是根据最终用户的需求为满足部门的特殊需要而建立的 在数据个体层中完成大多数启发式分析 * * * * * 第1章 决策支持系统的发展 演化过程 数据仓库技术完全是在决策需求的驱动下产生与发展起来的。 1960年:主文件、报表 1965年:主文件迅速增长,数据冗余严重 1970年:DASD及DBMS 便于存储、访问、索引 1975年:在线、高性能事务处理 1980年:个人PC和第四代编程语言 直接控制数据和系统 出现MIS,直到现在的DSS 抽取程序 大型在线事务处理系统问世后不久,就出现了用于抽取处理的程序。 抽取程序搜索整个文件或数据库,使用某些标准选择合乎要求的数据,并把这些数据传送到其他文件或数据库中去 抽取程序 抽取程序很受欢迎,是因为: 1.将数据从高性能在线事务处理环境中转移出来,减少性能冲突; 2.改变数据控制方式----由用户控制数据。 自然演化式体系结构 失控的抽取处理形成”蜘蛛网” 自然演化式体系结构的问题 数据可信性 生产率问题 难以将数据转化为信息 1.2.1 可信性问题 缺乏可信性的原因: 数据无时间基准 数据算法上的差异 抽取的多层次问题 外部数据问题 无公共起始数据源 1.2.2 生产率问题 多个数据来源导致数据定位复杂 需要不同技能的组合 相同元素的意义不同 …… 数据处理过程复杂 抽取程序很多 每个程序都需要定制 需要多种技术 …… 1.2.3 数据转化为信息的问题 面对众多的未集成遗留系统 没有存储足够的能够满足DSS分析员需求的历史数据 …… 今年的账号活动同过去五年中 的各个年份有什么不同? 体系化的数据仓库环境 自然演化式体系结构已不能满足需要 体系化的数据仓库应运而生 体系结构化环境主要存在两种数据:原始数据与导出数据 原始数据与导出数据差异巨大,不能共存在一个数据库 原始数据与导出数据的区别 原始/操作型数据 导出数据/DSS 原始/操作型数据 导出数据/DSS 面向应用 面向主题 重复运行 启发式运行 详细的 概要的或精化的 处理需求预先可知 处理需求事先不知 访问瞬间是准确的 过去的数据/快照 生命周期符合SDLC(System Development Life Cycle) 几乎刚刚相反 为日常工作服务 为管理者服务 对性能要求高 对性能要求宽松 可更新 不更新 一次访问一个单元 一次访问一个集合 原始/操作型数据 导出数据/DSS 原始/操作型数据 导出数据/DSS 事务处理驱动 分析处理驱动 静态结构,可变的内容 结构灵活 关心更新控制 无更新控制问题 一次处理数据量小 一次处理数据量大 高可用性 宽松的可用性要求 支持日常操作 支持管理需求 整体管理 子集管理 访问频繁 访问很少或不多 非冗余性 总是存在冗余 体系结构化环境有四个层次的数据 操作层 只包含面向应用的原始数据,并且主要服务于高性能事务处理领域 原子/数据仓库层 存储不可更新的集成的原始历史数据,此外也存放一些导出数据 部门/数据集市层 根据最终用户的需求为满足部门的特殊需要而建立的 个体层 完成大多数启发式分析 体系结构化环境 操作型环境中是当前信息而数据仓库环境中则是历史信息,二者没有重复 部门环境中的数据是反向规范化和汇总的,根据单个部门操作型需求形成的 个体层数据常常是暂时的、小规模的,要做很多启发式分析 数据仓库的用户 首先是商务人员,其次才是技术人员 在发现模式下工作 传统的系统开发生命周期不适用于DSS分析 开发生命周期 数据仓库环境下的系统开发生命周期与传统SDLC几乎完全相反 开发生命周期 操作型系统生命周期 SDLC 数据仓库生命周期CLDS 需求驱动 数据驱动 设计之初需求已知 DSS(Decision Support System)开发生命周期最后才发现真正的需求 瀑布式开发方法 螺旋式开发方法 …… …… 硬件利用模式 操作型环境 存在相对静态的且可预测稳定的硬件利用模式 数据仓库环境 二元模式,即要么利用全部硬件,要么根本不用硬件 二种环境不能在同一设备上实现二者优化 * * 数据仓库(Data Warehouse)技术完全是在决策需求的驱动下产生与发展起来的。 1960:只能顺序访问 1965:一致性;维护复杂;新程序开发复杂;支持主文件需要大量硬件 1970: * * * 失控的抽取处理模式存在很多问题: * * 二个部门呈现送报表 * 而且生成一个企业报表并不是一次性的,每一次都需要花费大量的资源. 生产率问题是自然演化式体系结构和遗留系
您可能关注的文档
最近下载
- 福彩市场管理员培训.pptx
- 7.2化石能源的合理利用教学设计---2024-2025学年九年级化学人教版(2024)上册.docx
- 35kv电缆头制作监理旁站记录.docx
- Unit 4 Plants around us Part C Make a paper garden(课件)人教PEP版(2024)英语三年级上册.pptx
- 中班综合《有趣的螃蟹》PPT课件.ppt
- 顺丰快递企业运作模式探析论文.pdf VIP
- 幼儿园课件:婴幼儿主被动操(1).ppt
- 《PCB设计与制作》课程标准.doc VIP
- 2020明辉学校开展“读书月系列活动”简讯美篇(可编辑).pdf VIP
- 行车轨道更换施工方案.docx
文档评论(0)