大数据平台基础组件介绍.pptx

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据平台基础组件 (HDFS、HBase、MapReduce、Yarn)介绍 ;目录; ;Hadoop 框架及应用堆栈;;;目录;7;HDFS(Hadoop Distributed File System)基于Google发布的GFS论文设计开发,适合运行在通用硬件上的分布式文件系统。其除具备其它分布式文件系统相同特性外,还有自己特有的特性: 高容错性:认为硬件总是不可靠的 高吞吐量:为大量数据访问应用提供高吞吐量支持 大文件存储:支持存储TB-PB级别的数据 ;HDFS是Hadoop技术框架中的分布式文件系统,对部署在多台独立物理机器上的文件进行管理。 主要应用于以下几种场景: 网站用户行为数据存储分析 生态系统数据存储分析 气象数据存储分析 ;系统设计目标;基本系统架构;HDFS数据读取流程;HDFS数据写入流程;HDFS数据写入流程;HDFS架构关键设计;HDFS联邦(Federation);数据副本机制;元数据持久化健壮机制;HDFS高可靠性;配置HDFS数据存储策略-标签存储;;HDFS总结-分布式文件系统;目录;HBase 基本介绍 1.1 HBase 基本定义 1.2 HBase 应用场景 1.3 HBase 产品定位 1.4 数据结构介绍 HBase 功能与架构;1.1 HBase基本定义;与关系型数据库RMDB比较;HBase适合具有如下需求的应用: 海量数据(TB、PB) 高吞吐量 需要在海量数据中实现高效的随机读取 需要很好的性能伸缩能力 能够同时处理结构化和非结构化的数据 不需要完全拥有传统关系型数据库所具备的ACID特性;1.3 HBase产品定位;1.4 数据结构介绍;按行存储/按列存储;KeyValue结构(1);;HBase 基本介绍 HBase 系统架构 2.1 HBase架构介绍 2.2 基本概念 —— Region 2.3 角色介绍 —— RegionServer 2.4 角色介绍 —— HMaster 2.5 HBase数据模型;2.1 HBase架构介绍;2.2 基本概念 —— Region(区域);2.3 角色介绍 —— RegionServer;基本概念 —— Region分类;2.4 角色介绍 —— HMaster;ZooKeeper;2.5 HBase数据模型–Column Family(列族) ;HBase数据模型 – KeyVaue ;HBase原理简介-分布式数据库;目录;MapReduce原理简介-分布式计算架构;MapReduce 应用场景; MapReduce的过程-图解MR ;Yarn在产品中定位;Yarn逻辑架构;Yarn的组件架构;资源表示模型;资源分配模型;容量调度器的介绍;容量调度器的特点;容量调度器的任务选择;用户限制;标签调度,应用感知的精细化调度;资源配??周期调整,资源错峰共享;目录;;华为大数据方案:提供大数据存储、处理、分析和消费平台;公安:大数据实现在海量数据中快速检索出价值信息;公安领域(实时监控);公安领域(实时监控);公安领域(全文检索);公安领域(全文检索);谢谢

文档评论(0)

139****3710 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档