统计学聚类分析文1.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学聚类分析文1

200902034035金融一班刘志伟 用聚类分析研究河南省各市三次产业就业人员差异化 产品直接取自自然界的部门称为第一产业,即农业,包括种植业、林业、牧业和渔业;对初级产品进行再加工的部门称为第二产业,即工业(包括采掘工业、制造业、自来水、电力、蒸气、热水、煤气)和建筑业;为生产和消费提供各种服务的部门称为第三产业,即除第一、第二产业以外的其他各业。根据我国的实际情况,第三产业可以分为两大部门:一是流通部门,二是服务部门。具体又可分为四个层次。第一层次:流通部门,包括交通运输业、邮电通讯业、商业饮食业、物资供销和仓储业;第二层次:为生产和生活服务的部门,包括金融、保险业,地质普查业,房地产、公用事业,居民服务业,咨询服务业和综合技术服务业,农林牧渔、水利服务业和水利,公路、内河(湖)航道养护业等;第三层次:为提高科学文化水平和居民素质服务的部门,包括教育、文化、广播电视,科学研究、卫生、体育和社会福利事业等;第四层次:为社会公共需要服务的部门,包括国家机关、政党机关、社会团体,以及军队和警察等。 聚类分析方法 聚类分析关注于根据一些不同种类的度量构造一些相似的对象组成的群体。关键的思想去确定对分析目标有利的对象分类方法。这个思想已经用于许多领域,包括天文学、考古学、医药、化学、教育、心理学、语言学和社会学。在聚类分析前,首先把数据标准化为Z-分数,采用系统聚类(Hierachical Cluster)方法,用音差平方和法(Ward法)计算欧几里得(Eudlidean)距离。聚类分析依据的基本原则是:直接比较样本中各事物之间的性质,,将性质相近的归为一类,而将性质差别比较大的分在不同类。也就是说,同类事物之间的性质差异小,类与类之间的事物性质相差较大。其中欧式距离在聚类分析中用得最广它的表达式如下: 其中Xik表示第i个样品的第k个指标的观测值,Xjk表示第j个样品的第k个指标的观测值,dij为第i个样品与第j个样品之间的欧氏距离。若dij越小,那么第i与j两个样品之间的性质就越接近。性质接近的样品就可以划为一类。当确定了样品之间的距离之后,就要对样品进行分类。分类的方法很多,本节只介绍系统聚类法,它是聚类分析中应用最广泛的一种方法。首先将n个样品每个自成一类,然后每次将具有最小距离的两类合并成一类,合并后重新计算类与类之间的距离,这个过程一直持续到所有样品归为一类为止。分类结果可以画成一张直观的聚类谱系图。应用系统聚类法进行聚类分析的步骤如下: ①确定待分类的样品的指标; ②收集数据; ③对数据进行变换处理(如标准化或规格化); ④使各个样品自成一类,即n个样品一共有n类; ⑤计算各类之间的距离,得到一个距离对称矩阵,将距离最近的两个类并成一类; ⑥并类后,如果类的个数大于1,那么重新计算各类之间的距离,继续并类,直至所有样品归为一类为止; ⑦最后绘制系统聚类谱系图,按不同的分类标准或不同的分类原则,得出不同的分类结果。 各地区(2006年)各按三次产业分就业人员数 (200年底) 区 第一产业 第二产业 第三产业 构成 (合计=100) 第一产业 第二产业 第三产业 全省 3050.03 1350.57 1318.12 53.3 23.6 23.0 郑州市 120.48 127.85 158.06 29.6 31.5 38.9 开封市 178.28 52.07 53.48 62.8 18.3 18.8 洛阳市 178.40 106.10 95.20 47.0 27.9 25.1 平顶山市 162.14 70.08 74.54 52.9 22.8 24.3 安阳市 162.58 99.90 67.00 49.3 30.3 20.3 鹤壁市 35.42 24.77 21.45 43.4 30.3 26.3 新乡市 149.79 84.47 55.42 51.7 29.2 19.1 焦作市 85.85 60.67 49.57 43.8 30.9 25.3 濮阳市 114.85 66.18 53.34 49.0 28.2 22.8 许昌市 133.56 77.09 63.12 48.8 28.2 23.1 漯河市 77.86 43.36 30.73 51.2 28.5 20.2 三门峡市 66.23 26.89 30.93 53.4 21.7 24.9 南阳市 353.86 137.50 147.44 55.4 21.5 23.1 商丘市 291.91 89.12 100.27 60.6 18.5 20.8 信阳市 237.15 79.88 134.43 52.5 17.7 29.8 周口市 357.82 146.68 156.44 54.1 22.2 23.7 驻马店市 308.

您可能关注的文档

文档评论(0)

xll805 + 关注
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档