- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE
PAGE 10 / 10
第二章 计量资料的统计描述
一、教学大纲要求
(一)掌握内容
频数分布表与频数分布图
频数表的编制。
频数分布的类型。
频数分布表的用途。
描述数据分布集中趋势的指标
掌握其意义、用途及计算方法。算术均数、几何均数、中位数。
描述数据分布离散程度的指标
掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。
(二)熟悉内容
连续型变量的频数分布图:等距分组、不等距分组。
二、 教学内容精要
计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般 均有计量单位。常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。
(一)频数分布表的编制
频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20 个病人的天数。如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。制作连续型数据频数表一般步骤如下:
求数据的极差(range)。
R ? X ? X (2-1)
max min
根据极差选定适当“组段”数(通常8—10 个)。
确定组段和组距。每个组段都有下限L 和上限U,数据χ 归组统一定为L≤χ U 。
写出组段,逐一划记。
频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。
(二)描述频数分布中心位置的平均指标
描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。
算术均数
算术均数(arithmetic mean)简称均数,描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用 X 表示,其计算方法如下:
直接法:直接用原始观测值计算。
X ? ? X (2-2)
n
加权法:在频数表基础上计算,其中X 为组中值, f 为频数。
X ? ? fX (2-3)
? f
几何均数
几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为 G。其计算公式为:
(1)直接法
(2)加权法
G ? lg ?1 ? ? lg X ? (2-4)
? ??
? ?
?1 ? ? f lg X ? (2-5)
? fG ? lg ?
? f
? ?
中位数
中位数(median)将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶
数时,取位次居中的两个变量的平均值。
为奇数时 M ? X
? n?1 ?
? ?
? 2 ?
(2-6)
??为偶数时 M ? 1 ?
?
?
2
?
X?X ?
X
?
n n
(2-7)
( ) ( ?1)
2 2
2-1 常用平均数的意义及其应用场合
平均数均数
意义
平均数量水平
应用场合
应用甚广,最适用于对称分布,特别是正态分布
几何均数 平均增(减)倍数
等比资料;对数正态分布
中位数 位次居中的观察值水平 偏态分布;分布不明;分布末端无确定值
(一)反映数据变异程度大小的变异指标
变异指标的应用亦根据资料的不同而选取不同指标进行描述。常用的变异指标有极差、四分位数间距、方差、标准差和变异系数,尤其是方差和标准差更为常用。
极差
极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
R ? X
百分位数与四分位数间距
max
X
min
(2-1)
百分位数(percentile)是将 n 个观察值从小到大依次排列,再把它们的位次依次
转化为百分位。百分位数的另一个重要用途是确定医学正常参考值范围。 百分位数用 P 表
x
示,0< x <100,如 25%位数表示为 P
。在频数表上,百分位数的计算公式为:
25
P ? L
x x
ix ?n ? x% ? ? f f L
x
? (2-8)
四分位数间距(inter-quartile range)是由第 3 四分位数(Q
= P
3 75
)和第 1 四分
位数(Q = P )相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,比极
1 25
差稳定。其计算公式:
方差
QR ? Q3 ? Q1 (2-9)
方差(variance)表示一组数据的平均离散情况,其计算公式为:
? ?X ? ? ?2
(2-10)
标准差
S 2 ?
n ? 1
? X 2 ?
? X 2 ? ( ? X ) 2
n ? 1
文档评论(0)