- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十一章最后一节,我们将累计频数检验用于经验分布与理论分布的比较,实际已经提供了拟合优度检验的一种方 法。 拟合优度检验与累计频数拟合优度检验相对应,在 评估从经验上得到的频数和在一组特定的理论假设下期望得到的频数之间是否存在显著差异时,是一种更普遍的检验方法。 现在我们再来看看第七章提到的著名的孟德尔豌豆试验。根据孟德尔提出的分离规律,纯种豌豆杂交后的子二代出现分化,红花植株与白花植株的数目应为3∶1。但由于随机性,观察结果与3∶1理论值总有些差距。因此有必要去考察某一大小的差距是否已构成否定3∶l理论的充分根据。这正是我们所讨论的拟合优度检验的问题。解决这类问题的工具,是卡·皮尔逊在1900年发表的一篇文章中引进的所谓 检验法。 首先把问题表述成一般模式。设一总体包含c种可区别的个体。根据某种理论或纯粹的假设,第i种个体出现的概率应为某个已知的数Pi(i=1, 2,…,c),有Pi>0, =1。这一组概率(P1 ,P3 ,…,Pc)就构成 了我们的理论分布。现在在该总体中随机地抽取一个容量为n的样本,发现其中第I 种个体的数目为fi (i=1,2,…,c),并有 =n。我们 要据此检验理论分布。 用概率论的语言可以这样说,设对象总体中随机变量X有c种取值。当X的取值是xi时,按零假设,其总体分布等于理论分布,即 P( )=Pi (i=1,2,…,c) 例如,就孟德尔的3∶1理论来说,c=2,P(x1)=3/4, P(x2)=1/4。现在从该总体中随机地抽取一个容量为n的样本,发现其中xi(i=1,2…,c)出现的次数为fi(i=1,2,…,c),并有 =n。知道了频数也就知 道了频率,即: 出现的频率为 ,并有 =1。 现在我们就是要据此经验分布来检验总体分布等于理论分布的零假设。 结论: 用 作为检定Ho成立的检验统计量,理论证明,当n足够大 时,该统计量 服从 分布,它是一种具有已知的并制成表的概率 分布,因此对给定的显著性水平α,可求得临界值 ,与 比 较,进而作出检验结论。 显而易见,理论频数fe与观测频数fo越接近, 统计值越小,经验 分布与理论分布拟合程度越好。反之,fe与fo差距越大, 值越 大,经验分布与理论分布拟合程度越差,拟合优度检验由此得 名。 [解] 检验的另一个重要应用是对交互分类资料的独立性检验,即列联表检验。在上一章,我们曾多次提到过性别与收入高低有无关联的问题,在实际中类似的问题很多。例如受教育程度与投票行为有无关联?吸烟与寿命长短有无关联?家庭小孩多少与收入多少有无关联?受教育时间长短与收入多少有无关联?血型与某种性格上的差异有无关联?等等,把这类问题上升到一般,就是在列联表的基础上考察变量X与Y有无关联。由于列联表一般是按品质标志把两个变量的频数进行交互分类的,所以: ① 检验法用于对交互分类资料的独立性检验,有其它方法无法比拟的优点; ②如何求得列联表中的理论频数就成了独立性检验的关键。 1、独立性、理论频数及自由度 应用举例 [例] 检验也适用于定类变量和定类变量的相关统计,即可以用它检定λ和τ系数是否显著。就下表所示资料,试以 检验检定性别与收入之间的相关程度是否显著(α取0.001)。 [解] 故拒绝H0,即认为总体上性别与收入高低之间不独立,有显著相关关系。 [例] 在某种流行病流行的时候,共有120个病人进行了治疗,其中40个病人按标准剂量服用某种新药,另有40个病人按标准剂量的2倍服用了这种新药,其余40个病人只按病状治疗(而不是按病因治疗),治疗结果按迅速痊愈、缓慢痊愈、未痊愈分为三类,最后交叉分类的情况列于下表,试问这三种疗法之间有没有差别(α取0.05)。 [解]H0:这三种疗法之间没有差别 H1:这三种疗法之间有差别由于α=0.05;自由度k=(c―l)(r ―l)=2×2=4,查 分布表得临界值: 在零假设下,计算检验统计量,计算过程参见后表。因此 > ,故拒绝零假设,即三种疗法之间有显著差别。 1.总变差及其分解 总变差 :在方差分析中记作SST,它表示 对于总均值 的偏差之平方和。即: SST= 式中: ni是第i个样本的容量, n= 可以看出,总变差分解成两部分:
您可能关注的文档
- 电器控制与PLC控制技术许缪第05章节可编程序控制器及其工作原理.ppt
- 秘书公关与礼仪课件编辑定稿秘书公关与礼仪第八章节秘书日常办公礼仪编辑定稿.ppt
- 电器控制与PLC控制技术许缪第08章节可编程序控制器的程序设计.ppt
- 秘书公关与礼仪课件编辑定稿秘书公关与礼仪第二章节公共关系的产生与发展编辑定稿.ppt
- 秘书公关与礼仪课件编辑定稿秘书公关与礼仪第九章节秘书专项业务礼仪编辑定稿.ppt
- 秘书公关与礼仪课件编辑定稿秘书公关与礼仪第六章节秘书礼仪概述编辑定稿.ppt
- 秘书公关与礼仪课件编辑定稿秘书公关与礼仪第七章节秘书个人基本礼仪编辑定稿.ppt
- 电器控制与PLC控制技术许缪第10章节可编程序控制器网络及通信.ppt
- 秘书公关与礼仪课件编辑定稿秘书公关与礼仪第三章节秘书公共关系的工作程序编辑定稿.ppt
- 电器控制与PLC控制技术许缪第09章节可编程序控制器应用.ppt
文档评论(0)