第八章分类资料的统计推断.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
复习 率的抽样误差与可信区间 一、 率的抽样误差与标准误 二、 总体率的可信区间 8.1 样本率与总体率比较 例8.1 已知某地40岁以上成人高血压患病率为8%,为降低患病率,经健康教育数年后,随机抽查2000人查出高血压患者100例,经健康教育后,该地高血压患病率是否有所下降? 1.建立检验假设 H0:π=π0=0.08。   H1:π≠0.08,   α=0.05 2.计算u值   本例n =2000,X=100,p=0.05,π0=0.08,代入公式8.1,得:        u=4.945 ? 3.确定P值  u=4.945>2.58, 故P0.01, 4.结论 按α=0.05的水准拒绝Ho,接受H1。故可以认为经健康教育后,该地高血压患病率有所下降。 小结 8.2 两样本率的比较 一、卡方检验的基本思想 χ2分布(chi-square distribution) χ2检验的基本公式 二、四格表专用公式 例子 三、连续性校正公式 例子(结论相反) 四、两个独立样本率比较的u检验 五、精确概率法(Fisher’s exact probability) 四格表资料分析小结 Fisher’s exact probability法均适用 卡方检验是一种近似检验 (1)当n≥40,T5时,可用。然当P值接近0.05时最好用Fisher’s exact probability法   (2) 当n≥40,有任一格1≤T<5时,可用Yates校正公式   (3) 当n<40或有T<1时,用Fisher’s exact probability 8.3 配对四格表资料的χ2检验 例8.7 某研究者以凝集试验和细菌培养两种方法,同时对124例慢性菌痢患者的粪便进行检查,结果见表,问两种方法检出阳性率是否有差别? 将每份标本分别用两种方法检测,其检出结果共有四种情况:即(1)两种方法都出现阳性(共有35例); (2)凝集试验阳性而细菌培养却是阴性(共有32例); (3)细菌培养阳性而凝集试验却是阴性(共有42例); (4)两种检测方法均为阴性结果(共有15例)。 上述几种情况的份数整理成配对四格表式如下: 配对四格表资料的χ2检验 (McNemars test) 配对四格表资料的χ2检验公式推导 8.4 行×列(R×C)表资料的χ2检验 R×C表的χ2检验通用公式 几种R×C表的检验假设H0 R×C表χ2检验的应用注意事项 R×C表χ2检验的应用注意事项(续) 1. 对R×C表,若较多格子(1/5)的理论频数小于5 或有一个格子的理论频数小于1,则易犯第一类错误。 出现某些格子中理论频数过小时怎么办? (1)增大样本含量(最好!) (2)根据专业知识将相邻的行或列进行合理合并。(丢失部分信息!有时甚至出假象!) (3)精确概率法。 (4)似然比χ2检验(likelihood ratio Chi-squre test) * 分类资料的统计推断 复习 率的抽样误差与可信区间 8.1 样本率与总体率比较的u检验 8.2 两个样本率的比较(卡方检验) 一、卡方检验的基本思想 二、四格表专用公式 三、连续性校正公式 四、u检验 五、Fisher’s exact probability 8.3 多组率或构成比的比较 8.4 配对设计的比较 一、率的抽样误差与标准误 二、总体率的可信区间 由于抽样造成样本率(p)和总体率(π)的差异称为率的抽样误差(sampling error) ,用率的标准误(standard error of rate)度量。 如果总体率π未知,用样本率p估计 总体率的可信区间 (confidence interval, CI):根据样本率推断总体率可能所在的范围。 原理:当n较大,p与(1-p)均不接近于零时,如: p 和n(1- p)均大于5,此时p的抽 样分布接近正态分布,可考虑u检验。 否则,应用二项分布原理直接计算概 率法。 样本率与总体率(一般为理论值、标准值或经大量观察所获得的稳定值等)比较的目的是推断该样本所代表的未知总体率与已知总体率是否相等。 1.样本率也有抽样误差,率的抽样误差的大小用σp衡量,实际工作中用Sp来估计。 2.二项分布当n足够大,π和1-π均不太小,有nπ≥5和n(1-

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档