医学统计学复习知识点汇集 .doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

正态分布(normaldistribution):随着观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线,称频数曲线,近似于数学上的正态分布。

变异系数(coefficientofvariance):是相对数没有单位,用来比较度量单位不同或均数相差悬殊的两组或多组资料间的变异度。

抽样误差(samplingerror):总体中各个体间存在差异,从总体中随机抽取一定量的样本,由样本计算的统计与总体参数之间的差异或各样本统计量之间的差异,称为抽样误差。

第一类错误:拒绝了实际上成立的H0,即样本原本来自μ=μ0的总体,由于抽样的偶然性得到了较大的t值,较小的P值,按α=0.05检验水准拒绝了H0,接受了H1,这类“弃真”错误称为第一类错误。

假设检验(hypothesistest):亦称显著性检验,其基本思想是先对总体的参数或分布做出某种假设,然后根据样本信息选用适当的方法,推断此假设应当拒绝或不拒绝。

同质(homogeneity):指被研究指标的影响因素相同;

变异(variation):指同质基础上的各观察单位间的差异。

变量(variable):进行搜集资料时,都要有明确的观察单位,然后对每个观察单位的某项特征进行观测,这种被观察单位的特征称为变量。

总体:总体是根据研究目的确定的同质研究对象中所有观察单位某种变量值的集合。

样本:样本是从总体中随机抽取部分观察单位(有代表性),其变量值的集合。

概率:是描述随机事件发生的可能性大小的量(数值),统计学上用符号“P”来表示。

误差:指测定值与真实值或研究结果与实际情况之间的差别,有系统误差、随机测量误差和抽样误差。

参数(paramerter):描述总体变量值特征的指标,一般未知,需通过样本指标估计,用希腊字母表示。

统计模型(statisticalmodel):指以概率论为基础,采用数学统计方法建立的模型.常用的这类模型有:标准差模型,回归模型.

可信区间(confidenceinterval):是按一定的概率100(1-)%估计总体均数所在的范围,亦称估计区间。常取的可信度为95%和99%。

卡方检验(chi-squaretest):是一种用途很广的假设检测方法,适用于分类变量资料中推断两个或多个总体率(或构成比)之间有无差别,两个分类指标之间有无相关关系的检验以及检验频数分布的拟合优度。

样本例数(samplesize):又称样本含量,样本大小,指样本中所包含的观察单位数。

四分位数间距(quartilerange):为上四分位数QU(即P75)与下四分位数QL(即P25)之差。其间包括一组观察值的一半,可看成是中间50%观察值的极差。其数值越大,变异度越大,反之,变异度越小。常用于描述偏态频数分布及分布的一端或两端无确切数值资料的离散程度。

全距(range):亦称极差,为一组同质观察值中最大值与最小值之差。它反映了个体差异的范围,描述定量资料的变异度大小。

频数表的用途和基本步骤:(1)揭示资料的分布特征和分布类型;(2)便于进一步计算指标和分析处理;(3)便于发现某些特大或特小可疑值。

基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。

统计工作的步骤:(1)设计;(2)搜集资料;来源:医学领域的统计资料主要来自三个方面,统计报表,经常性工作记录,专题调查或专题实验;要求:统计学对原始资料的要求是完整、准确、及时;贮存:注意资料的时效性、磁盘备份等。(3)整理资料:检查核对准确性和完整性,设计分组,拟定整理表,归表。(4)分析资料统计分析包括统计描述和统计推断(参数估计,假设检验)。

计量资料(数值变量):集中趋势(均数、几何均数、中位数、众数和调和均数,是描述一组同质观察值的平均水平或中心位置的指标)离散趋势:极差(全距)、四分位数间距、方差(总体方差和样本方差)、标准差和变异系数。

计数资料(分类变量):相对数(率、构成比、相对比、动态数列)

总体方差:样本方差:

标准误越小,表示抽样误差越小,样本平均数对总体平均数估计越可靠。

t分布:总体均数可信区间估计:

(1)σ未知且n小时(n小于30或50),按分布原理计算可信区间。

(2)σ未知但n足够大时(n大于100),t分布近似正态分布,按正态分布原理估计可信区间。

(3)σ已知,按正态分原理估计可信区间。

可信区间有两个要素:准确度(accuracy)和精密度(precision)。准确度反映可信度的大小,即可信区间包容总体均数的概率愈接近1愈好;精密度反映可信区间的长度,区间长

文档评论(0)

2017ll + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档