- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
次数分布表 简单次数分布(frequency distribution)表 相对次数(relative frequency)分布表 累积次数(cumulative frequency)分布表 大于制与小于制 累积相对次数分布表 次数分布表 某学校学生人数按性别分类 次数分布表 妙峰山圣母灵签次数分布表 次数分布表 某学校一年级学生语言能力测验得分次数分布表 某班级智商测验结果 制作步骤 求全距 全距指的是全部观察值中最大值与最小值之差。R=129-85=44。 决定组数和组距。 一般不少于5组,也不要超过15组。 组距指的是每一个组内包含的距离(用i表示) 斯特奇斯(H.A. Sturges)根据经验公式: 本例将N=30代入,得i=7.45,将组距调节为10,即每10分为一个组。组数:44/10=4.4,应该分5组。 决定组限 组限就是每一组的起点值和终点值。 登记次数 次数分布图 简单次(频)数分布图 相对次数分布图 累积次数分布图 累积相对次数分布图 简单次数分布图--直方图(histogram) 简单次数分布图--次数多边图(line graph) 次数多边图的优点 累积次数分布图 累积相对次数分布图 散点图(scatter plot) 轮廓图(profile chart) 雷达图(radar chart) 脸谱图(face graph) 常用统计指标 集中量 算术平均数 中位数 众数 加权平均数 几何平均数 调和平均数 差异量 全距 平均差 方差与标准差 相对差异量 差异系数 偏态量 峰态量 集中量 集中量(measures of central tendency)是代表一组数据典型水平或集中趋势的量。它能反映频数分布中大量数据向某一点集中的情况。 集中量包括算术平均数、加权平均数、几何平均数、调和平均数、中位数、众数等。 算术平均数 算术平均数(arithmetic mean)是所有观察值的总和除以总频数所得之商,简称为平均数或均数。 算术平均数的优点 反应灵敏; 严密确定,简明易懂,计算方便; 适合代数运算; 受抽样变动的影响较小; 样本算术平均数是总体平均数的最好估计值 算术平均数的缺点 易受两极端数值(极大或极小)的影响; 某村农户收入状况 120, 127, 130, 131, 132, 132, 135, 136, 137, 139, 140, 145, 146, 149, 153, 158, 160, 320, 400 平均数=162.63 一组数据中某个数值的大小不够确切时就无法计算其算术平均数。 中位数 中位数(median)是位于依一定顺序排列的一组数据中央位置的数值,在这一数值上、下各有一半频数分布着。 中位数的原始数值计算方法: 12 14 15 15 17 18 20 23 24: 17 12 14 15 15 17 18 20 23 24 25: 17.5 中位数的应用及其优缺点 中位数的应用及其优缺点 中位数虽然也具备一个良好的集中量所应具备的某些条件,例如比较严格确定、简明易懂,计算简便,受抽样变动影响较小,但是它不适合进一步的代数运算。它适用于以下几种情况: 一组数据中有特大或特小两极端数值时; 一组数据中有个别数据不确切时; 资料属于等级性质时。 众数 众数(mode)是集中量的一种指标。 对众数有理论众数及粗略众数两种定义方法 理论众数是指与频数分布曲线最高点相对应的横坐标上的一点。 粗略众数是指一组数据中频数出现最多的那个数。 粗略众数的计算方法 可以用观察法直接寻找一组数据中频数出现最多的那个数,就是粗略众数; 也可以将频数分布表中频数最多的组的组中值作为粗略众数。 众数的优缺点 众数虽然简明易懂,但是它并不具备一个良好的集中量的基本条件。它主要在以下情况下使用: 当需要快速而粗略地找出一组数据的代表值时; 当需要利用算术平均数、中位数和众数三者关系来粗略判断频数分布的形态时; 利用众数帮助分析解释一组频数分布是否确实具有两个频数最多的集中点时。 加权平均数 加权平均数(weighted mean)是不同比重数据(或平均数)的平均数。计算公式为: 几何平均数 几何平均数(geometric mean)是N个数值连乘积的N次方根。计算公式为 当一个数列的后一个数据是以前一个数据为基础成比例增长时,要用几何平均数求其平均增长率。 差异量 差异量(measures of dispersion)用于表示数据的变异程度或离散程度。常用的差异量有全距、平均差、方差、标准差和差异系数等。 全距 全距(range)指一组数据中最大值与最小值之差。 优点:概念清楚,意义明确,计算简单; 缺点:容易受极端数
文档评论(0)