- 1、本文档共117页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八 章 方差分析与试验设计 8.1 方差分析引论 8.2 单因素方差分析 8.3 方差分析中的多重比较 8.4 双因素方差分析 8.5 试验设计初步 学习目标 1.解释方差分析的概念 2.解释方差分析的基本思想和原理 3.掌握单因素方差分析的方法及应用 4.理解多重比较的意义 5.掌握双因素方差分析的方法及应用 6.掌握试验设计的基本原理和方法 学习重点 方差分析的基本思想和原理 单因素方差分析的方法及应用 多重比较的意义和方法 双因素方差分析的方法及应用 试验设计的基本原理和方法 学习难点 方差分析的基本思想和原理 单因素方差分析的方法及应用 双因素方差分析的方法及应用 方差分析及其有关术语 什么是方差分析(ANOVA)?(analysis of variance) 1.是检验多个总体均值是否相等的统计方法。 2.通过分析数据的误差判断各总体均值是否相等 以判断分类型自变量对数值型因变量的影响。如它们是否有关系,关系的密切程度如何。 方差分析中的有关术语 1 因素或因子(factor):所要检验的对象 2 水平或处理(treatment):因素的不同表现 3 观察值:每个因子水平下得到的样本数据 单因素方差分析:涉及一个分类型的自变量 双因素方差分析:涉及两个分类型的自变量 下面举例加以说明 分析四个行业之间的服务质量是否有显著差异,实际就是判断“行业”对“被投诉次数”是否有显著影响,可归结为检验四个行业被投诉次数的均值是否相等。 若它们的均值相等,则“行业”对被投诉次数是没有影响的,即各行业的服务质量没有显著差异; 若它们的均值不全相等,则“行业”对被投诉次数是有影响的,即各行业的服务质量有显著差异。 这里“行业”是要检验的对象,就是“因素”或“因子”。 零售业、旅游业、航空公司、家电制造业是“行业”这一因素的具体表现,就是“水平”或“处理” 。 在每个行业下得到的样本数据(被投诉次数)就是观察值。 由于这里只涉及“行业”一个总体,因此称为单因素四水平检验。 因素的每一个水平可以看做是一个总体,如零售业、旅游业、航空公司、家电制造业可看作是四个总体。上表中的数据可以看做是从这四个总体中抽取的样本数据。 在单因素方差分析中,涉及两个变量:一个分类型自变量,一个数值型的因变量。如判断“行业”对“被投诉次数”是否有显著影响,这里“行业”就是自变量,是一个分类型自变量,零售业、旅游业、航空公司、家电制造业是“行业”这一变量的具体取值,是“行业”这一因素的水平或处理 。 “被投诉次数” 是一个数值型的因变量,不同的被投诉次数就是因变量的取值。 方差分析就是判断分类型自变量对数值型因变量的影响。在本例中就是研究“行业”对“被投诉次数”的影响 方差分析的基本思想和原理 方差分析的图形分析 从散点图可以看出,不同行业对被投诉次数是有显著差异的,即使同一行业不同企业被投诉次数也明显不同。这表明同行业与被投诉次数之间有一定关系。若无关系,那么它们被投诉的次数应该差不多相同。 但散点图反映的不同行业对被投诉次数有显著差异可能由于抽样的随机性所造成的。因此,需要用更有效的方法来检验这种差异是否显著,也就是进行方差分析。 之所以称为方差分析,是因为在判断均值之间是否有差异时需借助于方差。即它是通过对数据误差来源的分析来判断不同总体的均值是否相等,达到分析自变量对因变量是否有影响的目的。 方差分析中的两类误差 随机误差 因素的同一水平(总体)下,样本各观察值之间的差异 比如,同一行业下不同企业被投诉次数是不同的 这种差异可以看成是随机因素的影响,称为随机误差 系统误差 因素的不同水平(不同总体)下,各观察值之间的差异 比如,不同行业之间的被投诉次数之间的差异 这种差异可能是由于抽样的随机性所造成的,也可能是由于行业本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差 下面结合本例数据说明两类误差 首先,在同一行业(同一总体)下,样本的各观察值是不同的(如零售业所抽取的7家企业之间被投诉的次数是不同的)。这是由于抽样的随机性造成的,这种误差就是随机误差。 其次,在不同行业(不同总体)下,各观察值也是不同的。这既可能由于抽样的随机性造成的,也可能由于行业本身所造成的。由行业本身所造成的误差是由于系统性因素引起的,这种误差就是系统误差。 方差分析中的两类方差 数据的误差用平方和(sum of squares)表示,称为方差。方差分为组内方差和组间方差。 组内方差(within groups) 因素的同一水平(同一个总体)下样本数据的方差 比如,零售业中所抽取的7家企业被投诉次数之间的误差。 组内方差只包含随机误差 组间方差(between groups) 因素的不同水平(不同总体)下各样本之间的方差 比如
文档评论(0)