SAS软件与统计应用教程 教学课件 汪远征 徐雅静 ch6.pdf

SAS软件与统计应用教程 教学课件 汪远征 徐雅静 ch6.pdf

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
SAS软件与统计应用教程 STATSTAT 第六章 主成分分析与因子分析 6.1 主成分分析 6.2 因子分析 SAS软件与统计应用教程 STATSTAT 6.1 主成分分析 6.1.1 主成分分析的概念与步骤 6.1.2 使用INSIGHT模块作主成分分析 6.1.3 使用“分析家”作主成分分析 6.1.4 使用PRINCOMP过程进行主成分分析 SAS软件与统计应用教程 STATSTAT 6.1.1 主成分分析的概念与步骤 1. 主成分分析基本思想 主成分分析是数学上对数据降维的一种方法。其基本 思想是设法将原来众多的具有一定相关性的指标 (比如 p 个指标),重新组合成一组新的互不相关的综合指标 来代替原来指标。通常数学上的处理就是将原来p 个指 标作线性组合,作为新的综合指标。但是这种线性组合, 如果不加限制,则可以有很多,应该如何去选取呢? SAS软件与统计应用教程 STATSTAT 在所有的线性组合中所选取的F 应该是方差最大的, 1 故称F 为第一主成分。如果第一主成分不足以代表原来 1 p 个指标的信息,再考虑选取F 即选第二个线性组合。 2 为了有效地反映原有信息,F 已有的信息就不需要再出 1 现在F 中,用数学语言表达就是要求Cov(F ,F ) =0 。 2 1 2 称F 为第二主成分,依此类推可以构造出第三、第 2 四、…、第p 个主成分。 SAS软件与统计应用教程 STATSTAT 2. 主成分分析的数学模型 设有n个样品 (多元观测值),每个样品观测p 项指标 (变量):X ,X ,…,X ,得到原始数据资料阵: 1 2 p x11 x12 ... x1p    x x ... x X  21 22 2p  (X 1 , X 2 ,..., X p )         x x ... x  n 1 n 2 np  其中Xi = (x 1i ,x2i ,…,xni) ,i = 1,2 ,…,p 。 SAS软件与统计应用教程 STATSTAT 用数据矩阵X 的p 个列向量 (即p 个指标向量)X 1 , X ,…,X 作线性组合,得综合指标向量: 2 p + + + F a X a X ... a X

您可能关注的文档

文档评论(0)

开心农场 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档