- 1、本文档共22页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
WORD资料下载可编辑
专业资料分享
第一章 绪论
1 多元统计分析的概念
多元统计分析就是利用统计学和数学方法,将隐没在大规模原始数据群体中的重要信息集中提炼出来,简明扼要的把握系统的本质特征,分析数据系统中的内在规律性。利用多元分析中不同的方法还可以对研究对象进行分类和简化。多元分析是实现做定量分析的有效工具。
2 多元分析的起源和发展
1)1928年,Wishart发表《 多元正态总体样本协差阵的精确分布》,是多元统计分析的开端;
2)20世纪30年代多元分析在理论上得到迅速发展;
3)20世纪40年代应用于心理、 教育 、生物等方面;但由于计算量太大,其发展受到影响;
4)50年代中期,由于电子计算机的出现和发展,使多元分析方法得到广泛应用;
5)60年代由于新理论、新方法不断涌现使多元分析方法的应用范围更加扩大;
6) 多元统计在我国发展较晚,70年代初在我国才受到各个领域的极大关注,应用日益广泛。
3 多元分析能解决的实际问题
??? 多元分析在工业、农业、医学、经济学、教育学、体育科学、生态学、地质学、社会学、考古学、环境保护、军事科学、甚至文学中都有广泛应用,足见其应用的深度和广度。
4 多元分析课程讲授的主要内容
本课程重点介绍多元分析中常用的六种方法: 聚类分析;判别分析;主成分分析;因子分析;对应分析;典型相关分析
我们这门课重点在于应用,参考课本中的公式推导为次要内容,大致了解即可,对每一种分析方法我们要清楚掌握它解决哪类问题、前提条件和局限性,以及它们相互之间的区别与联系;会用SAS、SPSS等数学软件实现上述过程,对所研究的问题能做出合理推断和科学评价。
5 原始资料阵及其标准化
1)原始资料阵:设有个样品,项指标(变量),组成矩阵
,
2)第项指标均值,
3)指标的协方差阵,其中
4)原始指标(变量)的标准化
第二章? 聚类分析
1? 什么是聚类分析
1.1 聚类分析的概念
聚类分析又称群分析、点群分析,是定量研究样品或指标分类问题的一种多元统计方法。其中类指相似元素的集合。
1.2 聚类分析的基本思想
认为所研究的样品或指标之间存在着程度不同的相似性,根据一批样品的多个观测指标,找出能够度量样品或变量之间相似程度的统计量,并以此为依据,采用某种聚类法,将所有的样品或变量分别聚合到不同的类中,使同一类中的个体有较大的相似性,不同类中的个体差异较大。
2 距离与相似系数
聚类分析的目的是将研究对象进行分类。它是在事先不知类别的情况下对数据进行分类的分析方法。分类的依据有两类:距离与相似系数。
2.1 变量的类型
1)间隔尺度变量:连续量,如速度,重量等。
2)间隔尺度变量:等级,有次序关系,如一级品、二级品等。
3)间隔尺度变量:无等级也无数量关系,如性别,产品型号。
2.2 常用的距离有以下几种:
1)明考夫斯基距离:
2)绝对距离:
3)欧氏距离:
4)切比雪夫距离:
5)马氏距离:,其中,为协方差阵
6)兰氏距离:
2.3 常用的相似系数有以下几种:
1)夹角余弦:
2)相关系数:
聚类分析根据所用方法不同可分为系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法等等;根据分类对象不同又分为对样品聚类(又称Q型聚类分析)以及对变量进行聚类(又称R型聚类分析)。对前者聚类多用距离,而后者聚类时多用相似系数。
3 系统聚类法
3.1 系统聚类法的基本思路
就近原则:首先,将n个样品看成n类,定义各样品之间的距离(此时其亦为类间距离);其次,按照某种原则将最接近的两类合并为一个新类,于是得到n-1类,定义并计算各类间距离,然后再从中找出最接近的两类合并成一个新类,重复以上步骤,直到全部样品合并成一类为止,将上述合并过程画成聚类谱系图,据此图可将全部样品分类。
3.2 八种系统聚类方法
正如样品之间的距离可以有不同的定义方法一样,类与类之间的距离也有各种定义。类与类之间用不同的方法定义距离,就产生了不同的系统聚类方法,系统聚类方法包括最短距离法﹑最长距离法﹑类平均法﹑重心法﹑WARD法等八种不同的方法,但这些方法聚类的步骤是完全一样的。当采用欧氏距离时,八种并类方法可归结为统一的递推公式。设,,,
1)最短距离法:;
2)最长距离法:;
3)类平均法:;
4)WARD法(离差平方和):;
3.3 谱系图及利用谱系图进行分类
根据谱系图确定分类个数的准则:
Bemirmen于1972年提出了应根据研究的目的来确定适当的分类方法,并提出了一些根据谱系图来分析的准则。
准则A:各类重心之间的距离必须很大;
准则B:确定的类中,各类所包含的元素都不要太多;
准则C:类的个数必须符合实用目的;
准则D:若采用几种不同的聚类方法处理
您可能关注的文档
- “营改增“最新企业内部承包责任合同模板书.doc
- (新版)全面质量管理复习题与答案解析(免费).doc
- “营改增”应对-物资采购合同模板范本(标准版).doc
- 《计算机应用基础》教(学)案--2018年-9-25.doc
- 《客户关系管理》教(学)案.doc
- 《行政法和行政诉讼法》复习重点.doc
- 【科学备考】2016年高考数学(理)(新课标)二轮复习配套试题(卷):第八章立体几何空间几何体的表面积和体积].doc
- 1保理融资服务合同模板-(两方).doc
- 4吨锅炉脱硫除尘设计方案和对策-(布袋+双碱法).doc
- 32肾病科慢性肾衰(慢性肾脏病4~5期)中医诊疗方案(2018版).doc
- 2022年山西省临汾市-统招专升本英语真题(含答案).pdf
- 2022八年级下册道德与法治期末复习计划.pdf
- 2022初中道法新课标的心得体会范文(通用5篇).pdf
- 2022年北京市海淀区八年级上学期期末物理试卷(含答案) .pdf
- 2022一级注册消防工程师《技术实务》预习试题(5)含答案.pdf
- 2022医养结合模式的调研报告_调研报告_.pdf
- 2022年小学信息技术说课稿四篇.pdf
- 2022届最新高考英语各省模拟试题汇编卷参考答案(全国甲卷).pdf
- 2022年煤炭生产经营单位(安全生产管理人员)考试内容及考试题库含答案参考58.pdf
- 2022年4月自考大学英语(二)试题及答案.pdf
最近下载
- XX附属中学集团化办学三年发展规划 .pdf
- ESICM 2023年ARDS的指南、定义、表型和呼吸支持策略.docx
- 小学数学六年级下册期末测试卷附答案.docx
- 部编版语文四年级上册第3单元习作《写观察日记》优质课件.pptx VIP
- 新北师大版九年级全一册初中物理全册教案(教学设计).doc
- WI-EA-7-W19001治具验收规范A2.doc
- TJSJCXH 4-2023 先张法预应力超高强混凝土管桩.docx VIP
- 人教版数学四年级下册期末测试卷附完整答案(易错题).docx
- 2024中国兵器工业集团有限公司总部招聘(29人)备考试题及答案解析.docx VIP
- 科尔摩根控制器操作手册.pdf
文档评论(0)