01-SPSS软件聚类分析过程的图文解释及结果的全面分析【精选】.doc

下载文档

7
0
约2.54千字
约 13页
2018-10-17 发布于湖北
举报
版权申诉
保障服务

01-SPSS软件聚类分析过程的图文解释及结果的全面分析【精选】.doc

1、本文档共13页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

O(∩_∩)O SPSS聚类分析过程聚类的主要过程一般可分为如下四个步骤： 1.数据预处理（标准化） 2.构造关系矩阵（亲疏关系的描述） 3.聚类（根据不同方法进行分类） 4.确定最佳分类（类别数） SPSS软件聚类步骤 1. 数据预处理（标准化） →Analyze(分析) →Classify (分类，归类)→Hierachical Cluster Analysis（层序聚类分析） →Method（方法，条理，）然后从对话框中进行如下选择从Transform Values框中点击向下箭头，此为标准化方法，将出现如下可选项，从中选一即可：标准化方法解释：None：不进行标准化，这是系统默认值；Z Scores（Z-Scores, 英文名又叫Standardized Population Data, 是以标准差单位来表现的一组观察值）：标准化变换；Range –1 to 1：极差标准化变换（作用：变换后的数据均值为0，极差为1，且|xij*|1，消去了量纲的影响；在以后的分析计算中可以减少误差的产生。）；Range 0 to 1（极差正规化变换 / 规格化变换）； 2. 构造关系矩阵在SPSS中如何选择测度（相似性统计量）: →Analyze →Classify →Hierachical Cluster Analysis →Method 然后从对话框中进行如下选择常用测度（选项说明）：Euclidean distance：欧氏距离（二阶Minkowski距离），用途：聚类分析中用得最广泛的距离；Squared Eucidean distance：平方欧氏距离；Cosine：夹角余弦(相似性测度；Pearson correlation：皮尔逊相关系数； 3. 选择聚类方法 SPSS中如何选择系统聚类法常用系统聚类方法 a）Between-groups linkage 组间平均距离连接法方法简述：合并两类的结果使所有的两两项对之间的平均距离最小。（项对的两成员分属不同类）特点：非最大距离，也非最小距离 b）Within-groups linkage 组内平均连接法方法简述：两类合并为一类后，合并后的类中所有项之间的平均距离最小 C）Nearest neighbor 最近邻法（最短距离法）方法简述：用两类之间最远点的距离代表两类之间的距离，也称之为完全连接法 d）Furthest neighbor 最远邻法（最长距离法）方法简述：用两类之间最远点的距离代表两类之间的距离，也称之为完全连接法 e）Centroid clustering 重心聚类法方法简述：两类间的距离定义为两类重心之间的距离，对样品分类而言，每一类中心就是属于该类样品的均值特点：该距离随聚类地进行不断缩小。该法的谱系树状图很难跟踪，且符号改变频繁，计算较烦。 f）Median clustering 中位数法方法简述：两类间的距离既不采用两类间的最近距离，也不采用最远距离，而采用介于两者间的距离特点：图形将出现递转，谱系树状图很难跟踪，因而这个方法几乎不被人们采用。 g）Ward’s method 离差平方和法方法简述：基于方差分析思想，如果分类合理，则同类样品间离差平方和应当较小，类与类间离差平方和应当较大特点：实际应用中分类效果较好，应用较广；要求样品间的距离必须是欧氏距离。谱系分类的确定经过系统聚类法处理后，得到聚类树状谱系图，Demirmen(1972)提出了应根据研究的目的来确定适当的分类方法，并提出了一些根据谱系图来分类的准则：任何类都必须在临近各类中是突出的，即各类重心间距离必须极大确定的类中，各类所包含的元素都不要过分地多分类的数目必须符合实用目的若采用几种不同的聚类方法处理，则在各自的聚类图中应发现相同的类实例分析 SPSS19.0分析软件聚类分析 4.2聚类分析——系统聚类法在数据编辑窗口的主菜单中选择“分析(A)”→“分类(F)”→“系统聚类(H)”（如图-4所示），弹出“系统聚类分析”对话框，将“地区”变量选入“标注个案(C)”中，将其他变量选入“变量框”中，如图-5所示。在“分群”单选框中选中“个案”，表示进行的是Q型聚类。在“输出”复选框中选中“统计量”和“图”，表示要输出的结果包含以上两项。单击“统计量(S)”按钮，在“系统聚类分析：统计量”对话框中选择“合并进程表”、“相似性矩阵”，如图-6所示，表示输出结果将包括这两项内容。单击“绘制(T)”按钮，在“系统聚类分析：图”对话框中选择“树状图”、“冰柱”，如图-7所示，表示输出的结果将包括谱系聚类图（树状）以及冰柱图（垂直）。单击“方法(M)”按钮，弹出“系统聚类分析：方法”对话框，如下图-8所示。 “聚类方法(M)”选项条中可选项