R软件应用多元分析II.pptx

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

R软件应用多元分析II

9、1主成分分析9、1、1总体主成分主成分得定义与导出假定您就是一个公司得财务经理,掌握了公司得所有数据,比如固定资产、流动资金、每一笔借贷得数额和期限、各种税费、工资支出、原料消耗、产值、利润、折旧、职工人数、职工得分工和教育程度等等。如果让您向上面介绍公司状况,您能够把这些指标和数字都原封不动地摆出去吗?当然不能。您必须要把各个方面作出高度概括,用一两个指标简单明了地把情况说清楚。本章介绍两种把变量维数降低以便于描述、理解和分析得方法:主成分分析(principalponentanalysis)和因子分析(factoranalysis)。实际上主成分分析可以说就是因子分析得一个特例。

例子:成绩数据100个学生得数学、物理、化学、语文、历史、英语得成绩如下表(部分)。目前得问题就是,能不能把这个数据得6个变量用一两个综合变量来表示呢?

主成分分析例中得得数据点就是六维得;也就就是说,每个观测值就是6维空间中得一个点。我们希望把6维空间用低维空间表示。以二维为例,如果这些数据形成一个椭圆形状得点阵(比如二维正态分布)在短轴Z2方向上,数据变化很少(方差小);进一步,短轴如果退化成一点,则长轴Z1即可解释这些点得变化;这样,由二维到一维得降维就自然完成了、这相当于在平面上做一个坐标变换、Z1,Z2就是X1,X2得特殊线性组合、X1X2Z1Z2

推广到p维情况:对于多维变量得情况和二维类似,也有高维得椭球,只不过无法直观地看见罢了。首先把高维椭球得主轴找出来,再用代表大多数数据信息得最长(方差大)得几个轴作为新变量;这样,主成分分析就基本完成了。注意,和二维情况类似,高维椭球得主轴也就是互相垂直得。这些互相正交得新变量就是原先变量得线性组合,叫做主成分(principalponent)。正如二维椭圆有两个主轴,三维椭球有三个主轴一样,有几个变量,就有几个主成分。选择越少得主成分,降维就越好。什么就是标准呢?那就就是这些被选得主成分所代表得主轴得长度之和占了主轴长度总和得大部分。有些文献建议,所选得主轴总长度占所有主轴长度之和得大约85%即可,其实,这只就是一个大体得说法;具体选几个,要看实际情况而定。

定义:设X就是p维随机变量,μ=E(X),Σ=var(X)考虑线性变换(p维坐标主轴→p维椭球主轴):我们希望Z1得方差达到最大(Z1就是椭球主轴中最长得一个主轴),则a1满足:max=λmax,a1就是Σ最大特征值(λ1)得特征向量、Z1=a1TX称为第一主成分、

特征方程,λ就是Σ得特征值a就是对应得特征向量

类似地,希望Z2得方差达到最大,为保证椭球得主轴也就是互相垂直得,a2与a1正交,即:cov(Z1,Z2)=a1TΣa2=0,类似地,a2就是Σ得第二大特征值(设为λ2),Z2=a2TX称为第二主成分、一般地,即为所求线性变换矩阵A.Zi=aiTX即为第i个主成分、,Q是正交阵.

2、主成分得性质主成分得均值和协方差阵、主成分得总方差、主成分分析就是把p个原始变量X1,X2,…,Xp得总方差分解成p个不相关变量(cov(Z1,Z2)=0,)Z1,Z2,…,Zp得方差之和、总方差中第i主成分Zi的比例称为主成分Zi的贡献率.总方差中前m个主成分Zi的贡献率之和称Z1,Z2,…,Zm的累积贡献率.Xj与Zi之间得相关系数、

2、主成分得性质m个主成分对原始变量得贡献率、总方差中前m个主成分Zi的贡献率之和称Z1,Z2,…,Zm对X1,X2,…,Xp的累积贡献率.Z1,Z2,…,Zm对Xj得累积贡献率:原始变量对主成分得影响、qji称为第i个主成分在第j个原始变量Xj上得载荷,她度量了Xj对Zi得重要程度、

3、从相关矩阵出发求主成分的方差矩阵是X的相关矩阵R.p个主成分为:相关矩阵R得主成分性质:E(Z*)=0;var(Z*)=Λ*,其中Λ*=diag(λ1*,λ2*,…,λp*).变量Xj*与主成分Zi*之间的相关系数为:主成分Z1*,Z2*,…,Zm*对Xj*的贡献率为:.设是相关矩阵R的p个特征值,是相应的单位特征向量。

9、1、2样本主成分总体得参数在实际问题中,通常就是未知得,则通过样本来估计。样本变量样本方差矩阵:样本相关矩阵R:相关记号:

大家有疑问的,可以询问和交流可以互相讨论下,但要小声点

1、从S出发求主成分S得特征值:λ1≧λ2≧…≧λp对应得特征向量

文档评论(0)

clz + 关注
实名认证
内容提供者

医师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年05月15日上传了医师资格证

1亿VIP精品文档

相关文档