演示文稿独立性检验的基本思想及其初步应用收藏.ppt

演示文稿独立性检验的基本思想及其初步应用收藏.ppt

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

演示文稿独立性检验的基本思想及其初步应用收藏本文档共23页;当前第1页;编辑于星期日\18点32分独立性检验的基本思想及其初步应用收藏本文档共23页;当前第2页;编辑于星期日\18点32分♂对于性别变量,其取值为男和女两种.♀这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.本文档共23页;当前第3页;编辑于星期日\18点32分生活中的分类变量是否吸烟,宗教信仰,国籍…两个分类变量之间是否有关系性别是否喜欢数学课程吸烟患肺癌本文档共23页;当前第4页;编辑于星期日\18点32分为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965那么吸烟是否对肺癌有影响?吸烟与患肺癌列联表列出两个分类变量的频数表,称为列联表本文档共23页;当前第5页;编辑于星期日\18点32分不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965吸烟者与不吸烟者患肺癌的可能性存在差异本文档共23页;当前第6页;编辑于星期日\18点32分本文档共23页;当前第7页;编辑于星期日\18点32分从上面数据和图形可以看出吸烟和患肺癌有关从上面数据和图形可以看出吸烟和患肺癌有关事实是否如此?我们能够有多大的把握认为“吸烟与患肺癌有关”?吸烟患肺癌本文档共23页;当前第8页;编辑于星期日\18点32分吸烟与患肺癌列联表不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d假设H0:吸烟与患肺癌没有关系A:不吸烟B:不患肺病P(AB)=P(A)(B)本文档共23页;当前第9页;编辑于星期日\18点32分a:事件AB发生的频数a+b:事件A发生的频数a+c:事件B发生的频数H0成立时(n=a+b+c+d)(a+b+c+d)a≈(a+b)(a+c)ad-bc≈0|ad-bc|越小吸烟与患肺癌之间的关系越弱|ad-bc|越大吸烟与患肺癌之间的关系越强本文档共23页;当前第10页;编辑于星期日\18点32分构造一个随机变量建立统一标准(n=a+b+c+d)若H0成立K2应该很小根据前面数据K2的观察值本文档共23页;当前第11页;编辑于星期日\18点32分在“吸烟与患肺癌没有关系”成立的条件下可以估算出k≈56.6326.635远大于99%的把握认为“吸烟与患肺癌有关系”利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.本文档共23页;当前第12页;编辑于星期日\18点32分确认“两个分类变量有关系”成立的可信程度假设该结论不成由观测数据计算K2的观测值k通过概率评价该假设不合理的程度k>6.635,假设不合理程度约为99%本文档共23页;当前第13页;编辑于星期日\18点32分y1y2总计x1aba+bx1cdc+d总计a+cb+da+b+c+d假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表2×2列联表本文档共23页;当前第14页;编辑于星期日\18点32分若要推断的论述为H1:“X与Y有关系”可以按如下步骤判断结论H1成立的可能性1.通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠度本文档共23页;当前第15页;编辑于星期日\18点32分本文档共23页;当前第16页;编辑于星期日\18点32分2.可以利用独立性检验来考察两个分类变量是否有关系并且能较精确地给出这种判断的可靠程度.根据观测数据计算检验随机变量K2的观察值kP(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828当得到的观测数据a,b,c,d都不于5时,可以通过查阅下表来确定其可信程度本文档共23页;当前第17页;编辑于星期日\18点32分

文档评论(0)

风高云蛋 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档