练习聚类与判别分析.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
练习1 聚类分析 在spss中输入《多元统计分析》教材88页例1中数据,将文件保存为“全国人口普查文化程度人口比例的聚类分析.sav”。 用spss定义四个变量:变量“地区”是字符串变量,其他3个变量是数值型变量定义(原数据表中的“序号”不需输入)。 单击菜单“开始” →“程序” →SPSS13.0”或者双击桌面上的“spss for windows 13.0”图标,打开SPSS程序。 单击程序左下角的Variable View(变量视图)选项卡,在变量视图工作界面中,Name下方输入第一个变量的名称“地区”,单击Type右侧的按钮,在弹出的Variable Type对话框中,单击String单选钮,Characters文本框中后的8是SPSS默认的字符型变量的长度,单击OK按钮,设置第一个变量类型为字符串变量,其长度为默认的8个字节。 接下来输入第二个变量名“DXBZ”,变量类型Type为默认的Numeric,设置它为整数型数值变量,单击label下方的方框,输入该变量的标签(变量的详细说明)“大学以上文化程度比例”。 采用类似方式,定义另外2个变量。 单击程序左下角的Data View(数据视图),进入数据视图工作界面,输入教材88页中数据。 1.1 基本操作 单击菜单Analyze→Classify→Hierarchial cluster,弹出系统聚类分析对话框。 从左侧的变量列表框中选择DXBZ、CZBZ和 WMBZ,移入Vairbale下方的方框中;选择“地区”,移入Label Cases by方框中。 单击Statistics按钮,进入统计量分析对话框。单击Cluster Membership下方的Single solution,在Number of cluster后方的文本框中输入4,将所有的地区划分为4类。 单击Continue按钮,返回到系统聚类分析对话框。 单击Plots按钮,进入图形设置对话框。勾选Dendrogram,在输出结果中显示聚类树形图。 单击Continue按钮,返回到系统聚类分析对话框。 单击OK按钮,输出系统聚类分析结果。 1.2 结果分析 1.个案处理综述表 显示有效(valid)个案数及其比例、 缺失(missing)个案个数及其比例以及全部(total)个案数及其比例。 本例中没有缺失数据,因此有效个案数和全部个案数是相同的。 2.聚结表 第1列(stage)显示聚类阶段。 第2、3列显示在某阶段中合并的个案编号。 第4列的系数显示两个个案之间的距离,该列中的系数是按照从小到大的顺序排列的,也就是距离越近的个案首先合并。 第5列显示首先个案首次聚类的阶段。如果这两列的数值都是0,表明两个个案的聚类;如果一个为1或大于1的值,一个为0,表明一个类和一个个案的聚类;如果两列数值是0以外的数值,表明两个类的聚类。 第6列显示新类下一步聚类的阶段。 聚结表显示第11号个案和第26号个案的距离最小,因此它们首先聚为一类,这个新类将在第7步和第15号个案聚类。 聚类过程的第2步是第3号和第5号个案,它们聚为一类,在第11步,这个新类将和第10号个案聚类。 聚类分析中其它步骤依次类推。最后可以把29个个案聚为4个类型:G1={1,2,4,6,7,8,9},G2={3,5,10,11,13,14,15,16,17,18,19,20,21,22,26,30},G3={12,23,24,27,28,29},G4={25}。 3.冰柱图 冰柱图和聚结表的作用类似,都是显示个案聚类情况的。从图中可以看出第1步聚类的第11号个案和第16号个案之间全部都用x填充,第2步聚类的第3号和第5号个案之间填充的x少了一个,第3步聚类的27号和28号个案之间填充的x又少了一个,依次类推,填充的x构成阴影条形就像倒挂的冰凌一样,因此该图称为冰柱图。 4.树形图 树形图显示系统聚类步骤,各个个案合并情况及其距离系数值。 图中显示浙江、陕西、山东、河北、内蒙、江苏、河南、湖北、四川、海南、福建、江西、湖南、广东、新疆和广西聚为一类,即前面的G2;黑龙江、山西、吉林、天津、上海、辽宁和北京聚为一类,即G1;安徽、宁夏、青海、贵州和云南聚为一类,即G3,西藏单独归为一类,即G4。 练习2 判别分析 在spss中输入《多元统计分析》教材128页例1中数据,将文件保存为“人文发展指数的判别分析.sav”。输入数据时增加一个变量“类别”,前5个国家的数值为1,后5个国家为2,最后4个待判国家不要输入数值。 2.1 基本操作 单击菜单Analyze→Classify→Discriminant,弹出判别分析对话框。 在判别分析对话框中,从左侧的变量列表框中选择x1、x2和x3,单击向右的箭头,将它们移入Indep

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档