《大数据应用基础》模块一 初识大数据 教学课件.pptxVIP

《大数据应用基础》模块一 初识大数据 教学课件.pptx

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

模块一初识大数据《大数据技术基础》北京出版社主编:张兵

目录模块一初识大数据任务一揭开大数据的神秘面纱 任务二追溯大数据的来源任务三探究大数据的特征及意义

任务一揭开大数据的神秘面纱

任务导入2022年“双十一”全网交易额超万亿:天猫占据销额榜首。天猫双十一期间,智能电玩、户外用品、猫狗宠物商品、适老家具等行业同比增长超过20%,面膜冷热仪、低碳清洗机、内衣洗衣机等148个细分趋势品类,同比增长超100%。天猫平台网站,从点击量、浏览历史和行为(如放入购物车)中实时发现顾客的即时购买意图和兴趣,并据此推送商品。天猫平台通过对大数据进行分析,能够准确把握单品的销售排名,消费者的年龄结构、甚至是个人的喜好,促成了平台交易额的不断上升,产生了巨大的经济效益。那么,天猫平台给出的大数据分析结果,如各行业销售同比分析,是使用了整个天猫平台网站所有用户的信息,还是部分用户的信息得到的?本任务从认识大数据开始,首先了解大数据的概念,然后辨析大数据和传统数据之间的区别,最后,得出结论。任务一揭开大数据的神秘面纱

任务目标1.能够说出大数据的概念。2.能够辨析大数据和传统数据之间的区别。3.能够产生对大数据技术的学习兴趣、理解创新驱动发展理念。任务一揭开大数据的神秘面纱

任务分析通过网络、微课等多方面的学习资源,自主查询大数据相关的定义,了解大数据的发展历史、大数据的应用、大数据的优势等知识,对大数据有较多的认识。基于对大数据概念的理解,通过小组合作的方式,针对大数据案例,进一步挖掘大数据的特点,讨论总结出大数据与传统数据之间的区别。根据大数据和传统数据之间的区别,得出大数据的数据范围,进而判断天猫平台给出的大数据分析结果,如各行业销售同比分析,是使用了整个天猫平台网站所有用户的信息,还是部分用户的信息得到的。123任务一揭开大数据的神秘面纱

任务实施Gartner大数据是需要新处理模式,才能具有更强的决策力、洞察发现力和流程优化能力,来适应海量、高增长率和多样化的信息资产。McKinseyApacheHadoop大数据是指其大小超出了典型数据库软件的采集、存储、管理和分析等能力的数据集。大数据是指普通的计算机软件无法在可接受的时间范围内捕捉、管理、处理的规模庞大的数据集。1.大数据的概念任务一揭开大数据的神秘面纱

任务实施2.大数据与传统数据数据规模不同传统数据规模相对较小大数据的数据量非常大数据类型不同传统数据多为结构化数据大数据多为非结构化数据处理方式不同传统数据通过采样的方式,选取部分数据进行处理。大数据注重整体数据的处理,而不进行数据的采样。任务一揭开大数据的神秘面纱

任务实施天猫平台给出的大数据,是对所有在天猫平台注册的所有用户信息进行统计的结果,既有用户的个人信息,如年龄、订单、购物车信息,也有商品的分类、出单情况。因此,天猫平台给出的大数据分析结果,使用了整个天猫平台网站所有用户的信息。3.得出结论任务一揭开大数据的神秘面纱

知识链接计算计算速度是非常关键的因素。为了提高计算速度,分布式系统基础架构Hadoop诞生了;MapReduce则为海量的数据提供了并行计算;Spark、Storm、Impala等各种各样的技术进入人们的视野。存储云计算使得网站的建设投入减少,就像使用水电一样,按量计费,不使用就不产生费用,不使用也不会浪费资源,有效促进了存储成本的下降。智能机器拥有理解数据的能力,在很多领域已经成功展示其优越性。例如:谷歌AlphaGo大胜世界围棋冠军李世石。大数据的支撑技术任务一揭开大数据的神秘面纱

知识拓展KBMBGBTBPBEBZB目前,大数据的范围从TB级发展到PB级。数据在计算机中存储的最小单位是bit,按从小到大的顺序还包括的单位有:Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。它们按照进率1024(2的10次方)来计算:1Byte=8bit,1KB=1,024Bytes,1MB=1,024KB,1GB=1,024MB,1TB=1,024GB,1PB=1,024TB,1EB=1,024PB,1ZB=1,024EB,1YB=1,024ZB,1BB=1,024YB,1NB=1,024BB,1DB=1,024NB。任务一揭开大数据的神秘面纱

任务二追溯大数据的来源

任务导入2022年冬奥会在中国举办,有哪些比赛事项是大家最为关注的呢?你可以到百度热搜的冬奥大数据中寻找答案,如图1-2所示。百度热搜以数亿用户海量的真实大数据为基础,通过专业的数据挖掘方法,计算关键词的热搜指数,旨在建立权威、全面、热门、时效的各类关键词排行榜,引领热词阅读时代。百度热搜,是当前互联网乃至整个大数据时代最重要的统计分析平台之一,自

文档评论(0)

土豆 + 关注
实名认证
文档贡献者

~

1亿VIP精品文档

相关文档