卡方检验完整版本.pdfVIP

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2

卡方检验是一种基于χ分布的假设检验方法,其应用十分广泛,特别是在离散变量的分析

2

中,χ分布最早于1875年由F.Helmet提出,他计算出来自正态总体的样本方差分布服

222

从χ分布,1900年KarlPearson在做拟合优度研究时也得出χ分布,并且提出χ统计

量,将其用于假设检验。

【卡方检验的主要用途包括以下几个方面】

1.检验某个连续变量的分布是否与某种理论分布相一致。如是否符合正态分布、是否服从均

匀分布、是否服从Poisson分布等

2.某无序分类变量各属性出现的概率是否等于指定概率,如骰子各面出现的概率是否等于1

\6,硬币正反两面是否等于0.5等

3.检验两个无序分类变量之间是否独立,有无关联,如收入与性别是否有关。

4.控制某种分类因素之后,检验两个无序分类变量各属性之间是否独立,如上述控制年龄因

素之后,收入与性别是否有关,

5.检验两个或多个样本率(总体率)或构成比之间是否存在差别,也称为同质性检验。

6.多个样本(总体)之间的多重比较

7.不同的方法作用于同一个变量时,产生的效果是否一致(配对检验)。如两种治疗方法作

用于同一组病人,疗效是否一样

在以上用途中,除了第一点是针对连续变量之外,其余都是针对无序分类变量,由此可见,

卡方检验大部分是用在分类变量的检验中发挥作用。

================================================

==

【卡方检验基本思想】

2

卡方检验是以渐进χ分布为基础,它的零假设H0是:观察频数与期望频数没有差别。

2

通过构造χ统计量,得出P值,并以此进行检验。

应该来讲,凡是通过构造χ2统计量进行检验的都属于卡方检验,卡方检验是一类检验(希

腊字母χ的英文音标就近似读为“卡”),我们在描述这些不同的卡方检验的时候,通常会加

上特定名称来加以区分,如Pearson卡方、McNemar配对卡方、似然比卡方等。由于是

pearson最早提出用卡方统计量做假设检验,所以我们平时说的卡方检验,很多时候就是

指pearson卡方。

=======================================

【χ2统计量的计算及意义】

2

χ统计量实际上表示观测值与理论值之间的偏离程度,其公式为

其中,Ai为i水平的观察频数,Ei为i水平的期望频数,n为总频数,pi为i水平的期望频

率。i水平的期望频数Ti等于总频数n×i水平的期望概率pi,k为单元格数。当n比较大

时,χ2统计量近似服从k-1(计算Ei时用到的参数个数)个自由度的卡方分布。

2

由卡方的计算公式可知,当观察频数与期望频数完全一致时,χ值为0;观察频数与期望

2

频数越接近,两者之间的差异越小,χ值越小;反之,观察频数与期望频数差别越大,两

22

者之间的差异越大,χ值越大。换言之,大的χ值表明观察频数远离期望频数,即表明远

22

离假设。小的χ值表明观察频数接近期望频数,接近假设。一旦χ超过了一定的临界值,

就可以认为观察频数与期望频数的差异超出了抽样误差允许的范围,也就可以认定二者是有

2

差异的。因此,χ是观察频数与期望频数之间距离的一种度量指标,也是假设成立与否的

22

度量指标。如果χ值“小”,研究者就倾向于不拒绝H0;如果χ值大,就倾向于拒绝H0。

2

至于χ在每个具体研究中究竟要大到什么程度才能拒绝H0,则要借助于卡方分布求出所

对应的P值来确定。

【卡方统计量具有以下特征】

2

1.χ值永远不会小于0

2

2.χ值具有可加性,几个相互独立的卡方变量的和仍然服从卡方分布

2

文档评论(0)

movie + 关注
实名认证
文档贡献者

喜欢分享的作者

1亿VIP精品文档

相关文档