第3章 描述统计量分析(DA) 教学课件数据分析基础—基于Python的实现 电子教案.pptx

第3章 描述统计量分析(DA) 教学课件数据分析基础—基于Python的实现 电子教案.pptx

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第3章 描述统计量分析(DA) 教学课件数据分析基础—基于Python的实现 电子教案 第 1 章1 -2022-12-05贾俊平2022-12-05统计学—Python实现—贾俊平贾俊平 2022-12-05Fundamentals of data analysis with Python数据分析基础基于 Python 的实现 第 3 章描述水平的统计量描述差异的统计量描述分布形状的统计量数据的综合描述贾俊平2022-12-05第 3 章 描述统计量分析数据分析基础—基于Python的实现3 -2022-12-05 第 3 章3.1描述水平的统计量描述水平的统计量——平均值简单平均数加权平均数# 简单平均数:80.0 # 加权平均数:81.0数据分析基础—基于Python的实现3 -2022-12-05 第 3 章3.1 描述水平的统计量描述水平的统计量——分位数——中位数分位数——一组数据按从小到大排序后,可以找出排在某个位置上的数值,该数值可以代表数据水平的高低。这 些位置上的数值就是相应的分位数(quantile)。常用的分位数有中位数、四分位数、百分位数等中位数——排序后处于中间位置上的值。不受极端值影响。具有稳健性或鲁棒性(robustness)位置确定数值计算# 计算30名学生考试分数的中位数中位数:85.0数据分析基础—基于Python的实现3 -2022-12-05 第 3 章3.1 描述水平的统计量描述水平的统计量——分位数——四分位数一组数据排序后处在25%和 75%位置上的数值。它是用3 个点将全部数据等分为4部分,其中每部分包含25%的数据。 很显然,中间的四分位数就 是中位数,因此通常所说的 四分位数是指处在25%位置上和75%位置上的两个数值Python默认的位置确定公式## 【例3-5】数据分析基础—基于Python的实现3 -2022-12-05 第 3 章3.1 描述水平的统计量描述水平的统计量——分位数——百分位数用99个点将数据分成100等份,处在各分位点上的数值就是百分位数。百分位数提供了各项数据在最小值和最大值之间分布的信息Python默认的位置确定公式# 计算30名学生考试分数的百分位数数据分析基础—基于Python的实现3 -2022-12-05 第 3 章3.1描述水平的统计量描述水平的统计量——众数一组数据中出现次数最多的变量值 一组数据可能没有众数或有几个众数实际中很少使用# 计算30名学生考试分数的众数众数=86数据分析基础—基于Python的实现3 -2022-12-05 第 3 章3.2 描述差异的统计量描述差异的统计量——极差和四分位差极差:一组数据的最大值与最小值之差 四分位差:上四分位数与下四分位数之差# 计算30名学生考试分数的极差和四分位差 # 极差=47# 四分位差:IQR = 19.5数据分析基础—基于Python的实现3 -2022-12-05 第 3 章3.2 描述差异的统计量描述差异的统计量——方差和标准差方差:各变量值与均值的平均差异标准差:方差的平方根样本标准差s# 计算30名学生考试分数的方差和标准差方差:174.6206896551724数据分析基础—基于Python的实现3 -2022-12-05# 标准差标准差:13.21 第 3 章3.2 描述差异的统计量描述差异的统计量——变异系数(CV)标准差与其相应的均值之比对数据相对离散程度的测度用于比较不同系列数据的离散程度计算公式【例3-9】(数据:example2_3. csv)沿用第2章的例2-3。计算6个城市AQI的平均数、标准差和变异系数,比较AQI 离散程度的大小数据分析基础—基于Python的实现3 -2022-12-05 第 3 章3.2 描述差异的统计量描述差异的统计量——标准分数对某一个值在一组数据中相对位置的度量,也称标准化值可用于判断一组数据是否有离群点(outlier)计算公式# 【例3—10】计算例3-1的标准分数标准分数:[ 0.3784 -1.8919 0.8324 -1.0594 -0.0757 1.2865 0.9081 -1.89190.5297 0.75670.227 -0.7567 1.2108 -0.6054 0.7567 -1.4378 0.454 0.4540.9081 0.3784-0.9838 0.0757 0.6811 -2.2702 1.1351 0.454 -0.3784 0.83240.1513 -1.0594]数据分析基础—基于Python的实现3 -2022-12-05 第 3 章3.3 描述分布形状的统计量描述分布形状的统计量——偏度系数计算公式# 计算偏度系数偏度系数: -0.8314数据分析基础—基于Python的实现3

文档评论(0)

151****1054 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

认证主体陶**

1亿VIP精品文档

相关文档

相关课程推荐