数据清洗 习题答案(黄源版) 第1-7章.pdfVIP

数据清洗 习题答案(黄源版) 第1-7章.pdf

  1. 1、本文档共8页,其中可免费阅读3页,需付费60金币后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据清洗是大数据时代,数据质量的重要保障,通常使用过滤的方式对数据集中的“脏数据”进行清洗,保证数据的有效性及准确性,常见的软件和工具有PythonR,安装步骤如下1登录Python官网,下载并安装到本地2选择对应的版本,下载并安装,可使用较新版本3安装R的方法同Python对于微积分的理解,主要有微分学积分学和线性代数三个方面微分学主要是研究函数局部变化率的学问,描述的是函数在某个点上的瞬时变化积分学是描述一个物体在一段时间内的动态性质,包括平均速度最大

数据清洗习题答案黄(源版)

练习1

1.阐述什么是数据清洗。

在大数据时代,数据清洗通常是指把“脏数据”底洗掉,所谓“脏数据”是

指不完整、不规范、不准确的数据,只有通过数据清洗才能从根本上提高数据质量。

数据清洗的结果是对各种信息复杂数据进行对应方式的处理,得到标准的、干净的、

连续的数据,提供给数据统计、数据挖掘等使用。

2.阐述什么是数据质量。

数据质量是对数据有效性以及准确性进行分析的

文档评论(0)

微传科技 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体唐山市微传科技有限公司
IP属地河北
统一社会信用代码/组织机构代码
91130281MA0DTHX11W

1亿VIP精品文档

相关文档