- 1、本文档共50页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
spss聚类分析过程
* 3、分类数的确定准则 根据树状结构图分类的准则 任何类都必须在邻近各类中是突出的,也就是说重心之间距离必须大; 各类所包含的元素都不要过分得多; 分类的数目应该符合使用的目的; 若采用几种不同的聚类方法处理,则在各自的聚类图上应该发现相同的类。 * 4、聚类方法的选择 没有最优的方法,一般结合分层聚类方法和迭代聚类方法一起分析。 影响聚类的因素有: 类的结构; 奇异值的存在; 类与类之间重叠的程度; 相似测度的选择。 * 5、聚类结果的解释和证实 解释: 计算各个聚类变量的均值,对均值进行比较分析。 证实: 采用不同的方法进行聚类,观察结果的稳定性; 重新从总体中抽样; 把样本分成两个,分别进行聚类分析。 * 四、分层聚类分析步骤 (1)打开数据文件 (2)执行命令:Analyze? classify?hierarchical cluster命令,打开hierarchical cluster analysis(分层聚类分析)对话框: Variables: 选择变量 Label cases: 选择标记变量 Cluster:cases为观测量聚类;variables为变量聚类。 Display:statistics为显示统计值;plots为显示图形。 其他四个按钮 * Statistics 按钮 Agglomeration schedule:聚类进度,系统默认选项; Proximity matrix:相似性矩阵。显示各项间的距离; Cluster membership:样品隶属类 None:不输出样品隶属类,为系统默认。 Single solution:输出隶属表,指定类的个数; Range of solutions:输出各种分类的隶属表。 * Plot 按钮 Dendrogram:龙骨图,输出聚类结果的龙骨图 Icicle:冰柱图 All clusters:显示全部聚类结果的冰柱图 Specified range of clusters:限制聚类解范围 None:不输出 Orientation:输出冰柱图的方向 Vertical:垂直 Horizontal:水平 * Method 按钮:cluster method (聚类方法) Between group linkage:组间联结法 Within group linkage:组内联结法 Nearest neighbor:最近距离法 Furthest neighbor:最大距离法 Centroid clustering:重心法 Median clustering:中位数法 Ward’s method:最小方差平方和法 * Method 按钮:measure (测度) Interval (连续变量的选择): Euclidean distance:欧氏距离 Squared Euclidean distance:欧氏距离的平方 Cosine:余弦相似距离 Pearson correlation:皮尔逊相关系数 Chebychev: Block:网格距离 Minkowski Customized:自定义 * Method 按钮:measure (测度) Counts (频数计数变量的选择): Euclidean distance:欧氏距离 Squared Euclidean distance:欧氏距离的平方 (其它略) * Method 按钮:measure (测度) Binary (二值变量的选择)数据的不相似性测度方法有: Chi-squared measure:卡方测度 Phi- -squared measure: * Method 按钮:transform values 转换方法有: None :不进行标准化,为系统默认 Z scores:Z得分 Range –1 to 1: Range 0 to 1: Maximum magnitude of 1: Mean of 1: Standard deviation of 1: * Method 按钮:transform measures 测度转换方法有: Absolute values : Change sign: Rescale to 0-1 range: * 五、聚类分析实例分析 见《社会统计分析方法—SPSS软件应用》,郭志刚主编,中国人民大学出版社,1999年12月。 P128页例1。 * 例1:步骤 打开数据文件; 打开分层聚类分析的主对话框: 选择四个变量; 选择对case进行聚类 统计量对话框中: 选择聚类进度表 选择single solution:4 clusters 在图对话框中: 选择龙骨图 不输出冰柱图 在聚类方法对话框中: 选择ward Interval中选欧氏距离 在保存新变量对话框中:选择分类数
文档评论(0)