独立性检验的基本思想及其初步应用 课件.pptVIP

独立性检验的基本思想及其初步应用 课件.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

独立性检验的基本思想及其初步应用1.分类变量变量的不同“值”表示个体所属的___________,像这样的变量称为分类变量.2.列联表(1)定义:列出的两个分类变量的___________,称为列联表.分类变量和列联表不同类别频数表(2)2×2列联表一般地,假设两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d分类变量及其关系的分析的理解(1)这里的“变量”和“值”都应作为广义的变量和值来理解,只要不属于同种类别都是变量和值,并不一定是取具体的数值,如:男、女;上、下;左、右等.(2)频数分析是指用不同类别的事件发生的频率的大小比较来分析分类变量是否有关联关系.(3)等高条形图更加形象直观地反映两个分类变量之间的差异,进而推断它们之间是否具有关联关系.1.等高条形图与表格相比,更能直观地反映出两个分类变量间是否___________,常用等高条形图展示列联表数据的___________.2.观察等高条形图发现_________和________相差很大,就判断两个分类变量之间有关系.等高条形图相互影响频率特征绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的;两列的数据对应不同的颜色.独立性检验独立性检验思想的理解及常用的几个数值(1)独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(K2≥6.635)≈0.01来评价假设不合理的程度,由实际计算得K2的观测值k>6.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信程度为99%.(2)在实际问题中要记住以下几个常用值:①若k≥6.635,则在犯错误的概率不超过0.01的前提下认为“X与Y有关系”;②若k≥3.841,则在犯错误的概率不超过0.05的前提下认为“X与Y有关系”;③若k≥2.706,则在犯错误的概率不超过0.1的前提下认为“X与Y有关系”;④若k<2.706,则认为没有充分证据显示“X与Y有关系”.1.观察下列各图,其中两个分类变量x,y之间关系最强的是()解析:在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.答案:D2.下面是一个2×2列联表:则表中a,b处的值分别为()A.94,96 B.52,50C.52,54 D.54,52y1y2总计x1a2173x222527总计b463.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③4.为了解决高二年级统计案例入门难的问题,某校在高一年级的数学教学中设有试验班,着重加强统计思想的渗透,下面是高二年级统计案例的测验成绩统计表(单位:分)的一部分,试分析实验效果.70及70分以下70分以上总计对照班321850试验班123850总计4456100附:P(K2≥k0)0.0250.0100.005k05.0246.6357.879利用等高条形图判断分类变量间的关系 2012年5月1日起我国对醉驾列入法律,交通事故明显降低,现从发生交通事故的司机中抽取2000名司机的随机样本,根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下:有责任无责任总计有酒精650150800无酒精7005001200总计13506502000(1)试作出相应的等高条形图;(2)结合等高条形图分析血液中含有酒精与对

您可能关注的文档

文档评论(0)

小小耕耘者 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档