典型相关分析因子分析.ppt

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
典型相关分析因子分析;要 点; 一、什么是典型相关分析及基本思想 ; 在解决实际问题中,这种方法有广泛的应用。如,在工厂里常常要研究产品的q个质量指标 和p个原材料的指标 之间的相关关系;也可以是采用典型相关分析来解决的问题。如果能够采用类似于主成分的思想,分别找出两组变量的线性组合既可以使变量个数简化,又可以达到分析相关性的目的。;例 家庭特征与家庭消费之间的关系;? ;y2; ; 然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对本身具有次大的相关性。;二、典型相关的数学描述 ; 如果我们记两组变量的第一对线性组合为: ;(二)典型相关系数和典型变量的求法 ;利用柯西不等式有 (参看式) ;记m为?12的秩,则;由特征向量可以构成一个正交矩阵T,有; 若取;相应的特征向量为; 第一对典型相关变量提取了原始变量x组和y组之间相关的主要部分,那么这部分的信息不够,则还可以在剩余相关中提取第二对典型变量:; 求;第二十页,共六十五页,2022年,8月28日; 当取;相应的特征向量为;注;方法二 根据数学分析中条件极值的求法,引入Lagrange乘数,求极值问题,则可以转化为求 ; 将上面的3式分别左乘 和 ;将 左乘(3)的第二式,得 ;将 左乘(3)的第一式,并将第二式代入,得 ; 结论: 既是M1又是M2的特征根, 和 是相应于M1和M2的特征向量。 ; ;例 家庭特征与家庭消费之间的关系;? ;典型相关分析 ;X组典型变量的系数 ;三、典型变量的性质 ;2、不同组的典型变量之间相关性 ;同对则协方差为?i ,不同对则为零。;3、原始变量与典型变量之间的相关系数 ;y典型变量系数矩阵 ;第三十九页,共六十五页,2022年,8月28日;第四十页,共六十五页,2022年,8月28日;第四十一页,共六十五页,2022年,8月28日;第四十二页,共六十五页,2022年,8月28日;例 家庭特征与家庭消费之间的关系;? ;典型相关分析 ;X组典型变量的系数 ;典型变量的结构(相关系数);典型变量的结构(相关系数); 两个反映消费的指标与第???对典型变量中u1的相关系数分别为0.9866和0.8872,可以看出u1可以作为消费特性的指标,第一对典型变量中v1与Y2之间的相关系数为0.9822,可见典型变量v1主要代表了了家庭收入, u1和 v1的相关系数为0.6879,这就说明家庭的消费与一个家庭的收入之间其关系是很密切的;; 第二对典型变量中u2与x2的相关系数为0.4614,可以看出u2可以作为文化消费特性的指标,第二对典型变量中v2与Y1和Y3之间的分别相关系数为0.8464和0.3013,可见典型变量v2主要代表了家庭成员的年龄特征和教育程度, u2和 v2的相关系数为0.1869,说明文化消费与年龄和受教育程度之间的有关。;4、各组原始变量被典型变量所解释的方差; 被典型变量解释的X组原始变量的方差 ; 被典型变量解释的Y组原始变量的方差 ; 5、简单相关、复相关和典型相关之间的关系;五、样本典型相关系数; 1、假设有X组和Y组变量,样本容量为n。假设( X1, Y1), ( X2, Y2),…, ( Xn, Yn),观测值矩阵为: ;第五十七页,共六十五页,2022年,8月28日; 2、计算特征根和特征向量 求M1和 M2的特征根 ,对应的特征向量 。则特征向量构成典型变量的系数,特征根为典型变量相关系数的平方。; 对两组变量x和y进行典型相关分析,采用的也是一种降维技术。我们希望使用尽可能少的典型变量对数,为此需要对一些较小的典型相关系数是否为零进行假设检验。H0经检验被拒绝,则应进一步检验假设。 ; 典型相关分析的基本思想:首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对本身具有最大相关性。如此下去,直至两组变量的相关性被提取完为止。本例想利用我国1999年城镇居民的家庭收入来源和消费性支出的数据了解我国居民消费构成及主要影响因素分析所用的数据来自:《中国统计年鉴》2000。; 收入指标:X1——可支配收入 X2——实际收入

文档评论(0)

xiaolan118 + 关注
实名认证
内容提供者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档