- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章
一、名词解释
1、参数 (parameter) :也叫参变量,是一个变量。如果我们引入一个或一些另外的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的变量叫做参变量或参数。描述总
体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
2、统计量 (statistic) :描述样本特征的数,是统计理论中用来对数据进行分析、检验的变量。
3、总体 (population) :根据研究目的确定的研究对象的全体。当研究有具体而明确的指标时,总体是
指该项变量值的全体。
4
、样本 (sample) :从总体中随机抽取的部分观察单位,总体中有
代表性的一部分。
5
、同质 (homogeneity)
:是指观察单位(研究个体)间被研究指标的影响因素相同。
6
、变异 (variation)
:同质事物个体间的差异。来源于一些未加控制或无法控制的甚至不明原因的因素。
7、 概率 (probability)
:度量随机事件发生可能性大小的一个数值,是一个在
0 到 1 之间的实数。
8、 抽样误差 (sampling error) :由于抽样所造成的样本统计量与总体参数的差别。
三、简答题
1、 统计学的基本步骤有哪些?
设计、搜集、整理、分析资料
2、 总体与样本的区别与关系?
区别:
总体:根据研究目的确定的研究对象的全体。当研究有具体而明确的指标时,总体是指该项变量值的全体。
样本:总体中有 代表性的一部分。
联系:总体包含样本,样本是总体中的一部分
3、 抽样误差产生的原因有哪些?可以避免抽样误差吗?
产生原因 :
(1)总体单位的标志值的差异程度。 差异程度愈大则抽样误差愈大,反之则愈小。
(2)样本单位数的多少。 在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小。
(3)抽样方法。 抽样方法不同,抽样误差也不相同。一般说,重复抽样比不重复抽样,误差要大些。
(4) 抽样调查的组织形式。 抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织形式的合理程度
也会影响抽样误差。
不可以,它具有不可避免性,只能减少抽样误差
4、 何为概率及小概率事件?
概率:度量随机事件发生可能性大小的一个数值,是一个在 0 到 1 之间的实数。
小概率事件:统计分析中的很多结论都基于一定置信程度下的概率推断,习惯上将
p ( A)≤ 0.05 或 ≤ 0.01 称为小概率事件,认为小概率事件在一次试验中不可能发生。
第二章第三章
1. 正态分布
(normal distribution)
:也叫高斯分布(
Gaussian distribution
),一种最常见、最重要的连
续型对称分布 (正态分布是对称分布,但对称分布不一定是正态分布)
中位数 (median) :是将一批数据从小至大排列后位次居中的数据值,反映一批观察值在位次上的平均水平。
3. 四分位数间距 (quartile interval) :是上四分位数与下四分位数之差 ,用四分位数间距可反映变异
程度的大小 .即: Q3 --Q1
方差 (variance) :样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。反映一组数据的平均离散水平。
5. 正偏态分布 (positively skewed distribution) :也称右偏态分布,右侧的组段数多于左侧的组段
数,频数向右侧拖尾
6. 负偏态分布
(negatively skewed distribution)
:左偏态分布,左侧的组段数多于右侧的组段数,
频数向左侧拖尾
7. 对数正态分布 (logarithmic normal distribution )
如果 X 是正态分布的随机变量,则 exp( X)
:对数为正态分布的任意随机变量的概率分布。
为对数分布;同样,如果 Y 是对数正态分布,则
log( Y)
为正态分布。
8. 医学参考值范围 (medical reference range)
产物的含量等各种数据的波动范围。最常用的是
:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢
95% 参考值范围。
三、简答题
1. 描述数值变量资料集中趋势的指标有哪些? 其适用范围有何异同?
平均数:描述一组变量值的集中位置或平均水平的指标体系。
不同的分布使用不同的指标
(算术 )均数:正态或近似正态或观察值相差不大的小样本资料
几何均数:对数正态分布或等比级数资料
中位数 :一般偏态分布(传染病发病的潜伏期)
描述数值变量资料离散趋势的指标有哪些?其适用范围有何异同?
反映数据的离散度( Dispersion )。即个体观察值的变异( variation )程度。常用的指标有:
极差
文档评论(0)