【2017年整理】第四章 统计描述.ppt

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【2017年整理】第四章 统计描述

第四章 统计描述 【内容提要】 本章介绍了描述统计。第一节介绍数据集中趋势的测度:算术平均数、调和平均数、几何平均数、中位数、众数、截尾均值等。第二节介绍数据离中趋势的测度:异众比率、全距、内距、平均差、方差、标准差等。第三节介绍数据分布形状的测度:偏态与峰态。最后一节演示了EXCEL描述统计功能的操作过程。 第一节 集中趋势的测度 集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。 一、算术平均数 算术平均数,是集中趋势测度中最重要的一种,它是所有平均数中应用最广泛的平均数。 算术平均数一般就称为平均数或均值。其定义是:观察值的总和除以观察值个数的商。 (一)简单算术平均数 根据未经分组整理的原始数据计算的均值。设一组数据为x1,x1,…xn,则简单算术平均数的计算公式如下: (二)加权算术平均数 根据分组整理的数据计算的算术平均数。其计算公式为: (三)算术平均数性质 1、各变量值与其算术平均数的离差之和等于零,即∑=0; 2、各变量值与其算术平均数的离差平方和最小,即∑=min。 二、调和平均数 调和平均数是根据标志值的倒数计算出来的平均指标,其意义与算术平均数一致。可以这样理解,调和平均数是在数据来源不同的情况下计算算术平均数的一种方法,调和平均数都可以通过数据转换,调整成算术平均数进行计算。 (一)调和平均数的计算方法 与算术平均数类似,调和平均数也有简单的和加权的两种形式,其计算公式分别为: (二)调和平均数特点 1、调和平均数易受极端值的影响,且受极小值的影响比受极大值的影响更大。 2、只要有一个变量值为零,就不能计算调和平均数。 3、当组距数列有开口组时,其组中值即使按相邻组距计算了,假定性也很大,这时,调和平均数的代表性就很不可靠。 4、调和平均数应用的范围较小。 三、几何平均数 几何平均数也称几何均值,它是n个变量值乘积的n次方根。根据统计资料的不同,几何平均数也有简单几何平均数和加权几何平均数之分。 (一)简单几何平均数 直接将n项变量连乘,然后对其连乘积开n次方根所得的平均数即为简单几何平均数。它是几何平均数的常用形式。计算公式为: (二)加权几何平均数 与算术平均数一样,当资料中的某些变量值重复出现时,相应地,简单几何平均数就变成了加权几何平均数。计算公式为: (三)几何平均数特点 1、几何平均数受极端值的影响较算术平均数小。 2、如果变量值有负值,计算出的几何平均数就会成为负数或虚数。 3、它仅适用于具有等比或近似等比关系的数据。 4、几何平均数的对数是各变量值对数的算术平均数。 四、众数 众数是一组数据中出现次数最多的变量值,一般用M0表示。众数一般用来表示分类数据的集中趋势,当然也可用来测度顺序数据和数值型数据的集中趋势。众数的计算方法依据原数据是否分组有所不同。只有在数据量较大的情况下,众数才有意义。 (众数的不唯一性) 10 5 9 12 6 8 五、中位数 中位数是将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据就是中位数。中位数用Me表示。 中位数的计算 确定中位数,必须将总体各单位的标志值按大小顺序排列,最好是编制出变量数列。这里有两种情况: 2、由分组资料确定中位数 由组距数列确定中位数,应先按的公式求出中位数所在组的位置,然后再按下限公式或上限公式确定中位数。 六、分位数 K(K=4、10、100等)分位数是指将一列数据K等分的各种数。K分位数用于测量数据的相对位置,反映数据的相对大小。把一列数据按从小到大的顺序排完后,计算第一K分位数的方法是: 式中N为数据总个数 最常见的分位数包括四分位数、十分位数和百分位数。 七、截尾均值 截尾均值是指在一个数列中,去掉两端的极端值后所计算的算术平均数,也称为切尾均值。 八、众数、中位数和算术平均数的比较 在次数分布完全对称时,算术平均数、众数和中位数都是同一数值;在尾巴拖在右边的正偏态(或右偏态)分布中,众数最小,中位数适中,算术平均数最大;在尾巴拖在左边的负偏态(或左偏态)分布中,众数最大,中位数适中,算术平均数最小,见课本图形。 第二节 离中趋势的测度 离中趋势又称为离散趋势,通过一系列变异指标来测度。变异指标是反映总体各单位标志值的差别大小程度的综合指标,又称标志变动度。 一般来讲,数据分布越分散,变异指标越大,平均指标的代表性越小;数据分布越集中,变异指标越小,平均指标的代表性越大。常用的变异指标有:异众比率、全距、平均差、方差和标准差、离散系数。 一、异众比率 异众比率是对分类数据离散程度的测度,反映众数的代表性。异众比率越小,众数的代表性越好。异众比率的计算方法为:非众数组

文档评论(0)

jiupshaieuk12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6212135231000003

1亿VIP精品文档

相关文档