- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
课时1数据整理与计算;1.学会根据实际需求,对表格数据进行简单整理、计算。
2.学会使用数据排序功能,把数据变为有序。
3.学会使用数据筛选功能,筛选出符合要求的数据。;;;1.数据整理的目的
数据整理的目的是______________________、整合数据资源、______________、提高数据质量。;2.常见的数据问题;(4)逻辑错误问题:数据集中的属性值与实际值不符,或违背业务规则或逻辑。
(5)格式不一致问题:对于不同来源的数据中存在格式不一致的情况,可根据后续分析和挖掘的需要进行__________。;3.常用表格数据处理和统计分析工具有Excel、SPSS、SAS、MATLAB等软件,也可以通过R、Python、Java等计算机语言编程进行数据处理。
4.使用Excel软件进行数据计算的一般方法
分析表格数据→______________→计算→分析计算结果,描述其含义。;5.数据计算
数据计算是数据处理的常用方法之一。在Excel软件中,主要有自定义公式和函数两种方式。
(1)自定义公式
以“=”开头,由常数、函数、单元格引用和运算符组成的式子。
(2)函数
函数是预定义的公式,通过使用参数按特定顺序或结构进行计算。常用函数有:sum、average、min和max等。;6.数据排序
(1)分为单个关键字排序和多关键字排序。
(2)排序时选择的数据区域必须是连续的。
(3)排序时根据情况选择有标题行或无标题行排序。
7.数据筛选(自动筛选)
筛选后表格中显示满足条件的记录,其他记录将被隐藏,筛选的范围是表格中的所有记录。自动筛选的方式主要有:
(1)自定义筛选。
(2)10个最大(小)的值,单位可以是项或百分比。
(3)多条件筛选。;1.数据整理的目的是检测和修正错漏的数据,整合数据资源,规整数据格式,提高数据的质量。常见的数据问题有数据缺失、数据重复、数据异常,存在逻辑错误、格式不一致或达不到分析要求等。
2.数据计算是数据处理的常用方法之一。日常简单的数据处理可以使用Excel软件完成,专业的数据处理和统计分析工具有SPSS、SAS、MATLAB等,也可以通过R、Python、Java等计算机语言编程进行数据处理。在Excel软件中,可以应用公式进行数据的计算。公式是以“=”号开头,由常数、函数、单元格引用和运算符组成的式子。;;例1下列关???数据整理的说法,正确的是()
A.数据集中的缺失值一般用任意值填充
B.数据集中的异常数据须直接删除或忽略
C.数据集中的重复数据可进行合并或删除
D.数据集中格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据
;;例2小王搜集了近5年各省(市)生产总值数据,并用Excel软件进行处理,如图a所示。;请回答下列问题:
(1)小王对收集的数据先进行了数据整理,以下关于数据整理说法错误的
是(单选,填字母)。?
A.对于数据缺失的问题,最简单的处理方法是忽略含有缺失值的实例或属性
B.对于重复数据,可以在进一步审核的基础上进行合并或删除等处理
C.逻辑错误的数据是指数据集中不符合一般规律的数据对象
(2)为计算图a中的“相对2016年的增长率(%)”,小王已经正确计算了单元格G4中的数据。他希望将单元格G4中的公式向下自动填充至单元格G34,再将区域G4:G34中的公式向右自动填充至J列,从而正确计算出区域G4:J34中的数据,则单元格G4中的公式应修改为。?;(3)利用图a数据制作的图表如图b所示,下列说法正确的是(多选,填字母,全部选对的得2分,选对但不全的得1分,不选或有选错的得0分)?
2020年北京、天津、上海生产总值情况图;;变式训练2小红在多家电商平台开设了自己的网店,她下载并合并了商品购买表和用户信息表得到新数据集,现要分析不同年龄、性别的用户购买商品种类、数量的情况。部分数据如图所示:;(1)分析前,小红对数据进行了整理,下列说法正确的是(多选,填字母)。?
A.数据整理有利于提高数据的质量
B.D列数据格式不一致,一般保留一种格式的数据,删除其他格式的数据
C.B9单元格与实际不符,存在逻辑错误问题
D.F4单元格数据缺失,最简单的处理方法是填充任意值;;;;2.小张合并商品购买表和用户信息表得到新数据集,部分数据如图所示。;;3.小慈从浙江省统计局网站上收集了2020年末人口数据,并用Excel软件进行处理,如图a所示。;(2)在数据完整的前提下,区域E5:El5的数据是通过公式计算得到的,在E5单元格中输入公式,再使用自动填充功能完成区域E6:El5的计算。?
(3)根据图a中数据制作的图表如图b所示。;关于该图表的描述,下列说法正确的是
您可能关注的文档
- 第一章 课时2 数据采集与编码(一) 课件(共56张ppt)浙教版(2019)必修1.pptx
- 第一章 课时3 数据采集与编码(二) 课件(共70张ppt)浙教版(2019)必修1.pptx
- 第一章 课时4 数据管理与安全、数据与大数据 课件(共78张ppt)浙教版(2019)必修1.pptx
- 第一章 验收卷(一) 数据与信息 课件(共27张ppt)浙教版(2019)必修1.pptx
- 课时1 Python程序设计语言基础 课件(共64张ppt)浙教版(2019)必修1.pptx
- 课时1 人工智能的概念与发展 课件(共49张ppt)浙教版(2019)必修1.pptx
- 课时1 算法的概念及描述 课件(共42张ppt)浙教版(2019)必修1.pptx
- 课时2 Python基本数据结构 课件(共74张ppt)浙教版(2019)必修1.pptx
- 课时2 大数据处理的基本思想与架构 课件(共42张ppt)浙教版(2019)必修1.pptx
- 课时2 人工智能的应用及对社会的影响 课件(共36张ppt)浙教版(2019)必修1.pptx
- 第18讲 第17课 西晋的短暂统一和北方各族的内迁.docx
- 第15讲 第14课 沟通中外文明的“丝绸之路”.docx
- 第13课时 中东 欧洲西部.doc
- 第17讲 第16 课三国鼎立.docx
- 第17讲 第16课 三国鼎立 带解析.docx
- 2024_2025年新教材高中历史课时检测9近代西方的法律与教化含解析新人教版选择性必修1.doc
- 2024_2025学年高二数学下学期期末备考试卷文含解析.docx
- 山西版2024高考政治一轮复习第二单元生产劳动与经营第5课时企业与劳动者教案.docx
- 第16讲 第15课 两汉的科技和文化 带解析.docx
- 第13课 宋元时期的科技与中外交通.docx
文档评论(0)