大数据技术原理和应用林子雨版课后习题答案解析.doc

大数据技术原理和应用林子雨版课后习题答案解析.doc

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第一章

1.试述信息技术发展史上的3次信息化浪潮及具体内容。

信息化浪潮

发生时间

标志

解决问题

代表公司

第一次浪潮

1980年前后

个人计算机

信息解决

Intel、AMD、IBM、苹果、微软、联想、戴尔、惠普等

第二次浪潮

1995年前后

互联网

信息传播

雅虎、google、阿里巴巴、百度、腾讯等

第三次浪潮

前后

物理网、云计算和大数据

信息爆炸

将涌现出一批新的市场标杆公司

试述数据产生方式经历的几种阶段

答:运营式系统阶段,顾客原创内容阶段,感知式系统阶段。

试述大数据的4个基本特性

答:数据量大、数据类型繁多、解决速度快和价值密度低。

试述大数据时代的“数据爆炸”的特性

答:大数据时代的“数据爆炸”的特性是,人类社会产生的数据一致都以每年50%的速度增长,也就是说,每两年增长一倍。

数据研究经历了哪4个阶段?

答:人类自古以来在科学研究上先后历经了实验、理论、计算、和数据四种范式。

试述大数据对思维方式的重要影响

答:大数据时代对思维方式的重要影响是三种思维的转变:全样而非抽样,效率而非精确,有关而非因果。

大数据决策与老式的基于数据仓库的决策有什么区别

答:数据仓库具有批量和周期性的数据加载以及数据变化的实时探测、传播和加载能力,能结合历史数据和实时数据实现查询分析和自动规则触发,从而提供对战略决策和战术决策。

大数据决策可以面向类型繁多的、非构造化的海量数据进行决策分析。

举例阐明大数据的基本应用

答:

领域

大数据的应用

金融行业

大数据在高频交易、社区情绪分析和信贷风险分析三大金融创新领域发挥重要作用。

汽车行业

运用大数据和物联网技术的五人驾驶汽车,在不远的将来将走进我们的平常生活

互联网行业

借助于大数据技术,可以分析客户行为,进行商品推荐和有针对性广告投放

个人生活

大数据还可以应用于个人生活,运用与每个人有关联的“个人大数据”,分析个人生活行为习惯,为其提供更加周全的个性化服务。

举例阐明大数据的核心技术

答:批解决计算,流计算,图计算,查询分析计算

大数据产业涉及哪些核心技术。

答:IT基本设施层、数据源层、数据管理层、数据分析层、数据平台层、数据应用层。

定义并解释如下术语:云计算、物联网

答:云计算:云计算就是实现了通过网络提供可伸缩的、便宜的分布式计算机能力,顾客只需要在具有网络接入条件的地方,就可以随时随处获得所需的多种IT资源。

物联网是物物相连的互联网,是互联网的延伸,它运用局部网络或互联网等通信技术把传感器、控制器、机器、人类和物等通过新的方式连在一起,形成人与物、物与物相连,实现信息化和远程管理控制。

具体论述大数据、云计算和物联网三者之间的区别与联系。

大数据、云计算和物联网的区别

大数据、云计算和物联网的联系

大数据侧重于海量数据的存储、解决与分析,海量数据中发现价值,服务于生产和生活;云计算本质上皆在整合和优化多种IT资源并通过网络已服务的措施,便宜地提供应顾客;物联网的发展目的是实现呜呜向量,应用创新是物联网的核心

从整体来看,大数据、云计算和物联网这三者是相辅相成的。大数据根植于云计算,大数据分析的诸多技术都来自于云计算,云计算的分布式存储和管理系统提供了海量数据的存储和管理能力,没有这些云计算技术作为支撑,大数据分析就无从谈起。物联网的传感器源源不断的产生大量数据,构成了大数据的重要数据来源,物联网需要借助于云计算和大数据技术,实现物联网大数据的存储、分析和解决。

第二章

试述hadoop和google的mapreduce、gfs等技术之间的关系

答:Hadoop的核心是分布式文献系统HDFS和MapReduce,HDFS是google文献系统GFS的开源实现,MapReduces是针对googleMapReduce的开源实现。

试述Hadoop具有哪些特性。

答:高可靠性,高效性,高可扩展性,高容错性,成本低,运营在Linux平台,支持多种编程语言

试述Hadoop在各个领域的应用状况。

答:,雅虎在Sunnyvale总部建立了M45——一种涉及了4000个解决器和1.5PB容量的Hadooop集群系统;

Facebook重要将Hadoop平台用于日记解决,推荐系统和数据仓库等方面;

百度重要使用Hadoop于日记的存储和记录、网页数据的分析和挖掘、商业分析、在线数据反馈、网页聚类等。

试述Hadoop的项目构造以及每个部分的具体功能。

答:

Pig

Chukwa

Hive

HBase

MapReduce

HDFS

Zookeeper

Common

Avro

Commeon是为Hadoop其她子项目提供支持的常用工具,重要涉及文献系统、RPC和串行化库

Avro是为Hadoop的子项目,用于数据序列化的系统,提供了丰富的数据构造类型、迅速可压

您可能关注的文档

文档评论(0)

黄锦文 + 关注
实名认证
内容提供者

美女

1亿VIP精品文档

相关文档