第11章 典型相关分析2第11章 典型相关分析2.doc

第11章 典型相关分析2第11章 典型相关分析2.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十一章 典型相关分析 主成分分析、因子分析研究的是一组变量间或一组观测间的相互关系。而当研究两组变量间的相互关系时,一般不采用各自的分析或两个变量一对一的直接分析。例如,在研究一组环境因素与畜禽诸生产性能间的相关性时,通常是把各环境因素当作一个整体,把各生产性能也作一个整体来研究。这时研究两个整体之间的相关可化为研究两个新变量之间的相关关系,而这两个新变量将分别由各自整体中变量的线性组合所构成,因此不会丢失原有诸变量的任何信息。这样构成的两个新变量具有最大相关的性质。类似地还可找出由两组变量构成的第二对线性组合,该组合与第一对线性组合不相关,但该对组合间有最大的相关。如此类推,直到两组变量的相关被分解完毕。这种逐步得到的线性组合称为典型变量,它们之间的相关系数称为典型相关系数。这种分析方法称为典型相关分析(Canonical Correlations Analysis)。 可见,典型相关分析是研究两组变量之间相关关系的一种统计方法,它避免了孤立地对两个变量间的研究,分析结果较为全面,且各组中变量的个数不受限制,两组的内容可以不相同。因此,应用十分广泛。 11.1 概述 在实际工作中,通常接触到的多为样本资料,所以典型相关系数及典型变量多数是从样本资料中获取。其计算方法如下。 设有两组变量X1{x1,x2,…,xp}和X2{xp+1,xp+2,…,xp+q}的n次观察值,取自多元正态总体Np+q(μ,∑),由X[X1,X2]算得协差阵为∑的最大似然估计,若对X1、,X2进行标准化,此时协差阵为相关阵R: 其中R11为第一组各变量间的相关系数阵,R22为第二组各变量间的相关系数阵,各变量间的相关系数阵。设P≤q解得特征方程或的非零特征根 (r≤p)的算术平方根,即为典型相关系数。将求得各特征根四代上两式,可求得与典型相关系数相对应的特征向量(典型变量)αi及βj,于是第i对典型变量(线性组合)为: V i=α1x1+α2x2+…αpxp Wj=β1xp+1+β2xp+2+…βqxp+q 其中αi、βj亦称负荷量,用来反映该变量对两组变量的相关中所起的作用或影响的程度。 实际工作中对R特征根以及相应特征向量的求得通常借助相关的软件来完成。 15.2 典型相关分析的SAS过程 过程格式: PROC CANCORR VAR WITH PARTIAT FREQ WEIGHT BY 选项串; 变量名称串; 变量名称串; 变量名称串; 变量名称; 变量名称; 变量名称串; 语句说明: 通常只用到第1—3道指令。 CANCORR:为典型相关分析过程。其选项串:⑴控制报表打印的有①S,印出平均数与标准差。②C,印出原始变量间的相关阵。③RED,印出典型冗余分析的统计值,其值可用来探讨原始变量被典型变量解释的百分比。④ALL,印出所有的统计值。⑤SHORT,只印出典型相关系数与其F检验的显著性。⑥NOPRINT,不印出分析的结果。⑦NCAN=正整数,印出前n对典型变量的所有统计值。⑵界定计算过程中某些变量的选项有①EDF=正整数,界定F检验的分母自由度,内设值为有效观察值次数总和减1。②RDF=正整数,界定F检验分子的自由度。③NOINT,分析中不包括截距。④VP=典型变量名字,内设值为V1、V2…等。⑤典型变量名字,内设值为等。⑥VN=‘VAR 变量名称’,在报表中印出VAR语句中给变量串的命名。⑦WN=‘WITH变量名称’,在报表中印出WITH语句中给变量串的命名。⑶有关回归分析的选项有①VDEP WREG,要求将VAR的变量串当作依变量,将WITH变量串当作自变量进行多元回归分析。②WDEP VREG,自变量与依变量的界定与①相反,作多元回归分析。⑷回归分析中产生统计量的选项有①ALL,要求报表中印出所有统计量。②INT,与B、SEB、T或PROBT联用,要求回归分析的模型中有截距。③B,印出偏回归系数。④SEB,印出偏回归系数的标准误。⑤T和PROBT,印出偏回归系数t检验的t值及概率。⑥STB,印出通径系数。⑦SMC,印出相关指数R2及F检验结果。⑧CORRB,印出回归系数间的相关系数阵。⑨CORR,印出偏相关系数等。 VAR语句 界定两组变量中第1组变量的名称串。 WITH语句 界定两组变量中第2组变量的名称串。 PARTIAL语句 要求执行典型偏相关分析,即对两组变量的偏相关阵进行典型相关分析。 FREQ、WEIGHT及BY语句同前述。 11.2 程序应用 例11—1 测得18周内密闭式蛋鸡舍内12个笼位上的温度x1、湿度x2、相对湿度x3、露点温度x4、蛋鸡舒适度x5,以及随机抽查位点上(每位64只)40—57周龄罗曼褐壳系商品代蛋鸡的每周产蛋率y1、平均蛋重y2及周总产蛋量y3的资料如程序数据步中

您可能关注的文档

文档评论(0)

ptaosqi + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档