第十四章相关分析.pptVIP

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十四章 相关关系 集中量数和差异量数主要用于描述单变量数据资料的分布特征,相关系数用于描述双变量数据资料相互之间的关系特征 第一节 相关、相关系数与散点图 一、什么是相关 变量间的关系可以分成两类 一类是变量间存在着完全确定性的关系,可以用精确的数学表达式来表示,它们之间的关系是确定性的,只要知道了其中两个变量的值就可以精确地计算出另一个变量的值,这类变量间的关系称为函数关系。 另一类是变量间关系不存在完全的确定性关系,不能用精确的数学公式来表示,如人的身高与体重的关系;统计学中把这些变量间的关系称为相关关系,把存在相关关系的变量称为相关变量。常常用相关系数或回归方程来描述。 事物间的关系解释为: 因果关系 共变关系 相关关系 这是从变量的事物本性角度出发,而前面是从变量的数理特征的角度出发。 二、相关系数 样本间相关系数用r表示 总体间相关系数用ρ来表示 -1 ≤ r ≤ 1 三、散点图 相关告诉我们变量 X 和 Y之间关系的3个特征 1)关系的方向 正相关 (正数) 意味着两个变量向相同的方向变化. 亦即, 一个变量增加, 另一个变量也增加. 负相关 (负数) 意味着两个变量向相反的方向变化. 亦即, 一个变量增加, 另一个变量反而减少. 2)关系的形式 本课集中讨论线性(直线)相关, 但两变量的关系也有其他形式 3)关系的强度 相关也度量了X 和 Y间关系的强度.相关系数的值 在-1 和 +1之间. 0相关意味着没有关系. +1 意味着完全的正相关 之间 两个, -1 意味着完全的负相关. r=0.7高度相关, r=0.5中度相关, r=0.3明显相关, 3)为什么 (以及何时) 要用到相关? ⑴预测- 如果两个变量间有强相关, 我们就可以根据一个变量的值,预测另一个变量的值。 如, 如果知道胎儿头部的超声波尺寸与婴儿出生时体重有正相关,则可预测婴儿出生时体重 (4)理论验证 – 许多理论预测不同的变量之间存在某种关系. 然后我们收集数据, 来考察这样的关系是否存在 第二节 积差相关 一、概念及其适用的范围 1、积差相关又叫皮尔逊相关,是英国统计学家皮尔逊(高尔顿之学生)提出的一种计算相关的方法。是用来揭示两个变量相关方向和程度最常用的和基本的方法。 2、积差相关的使用条件 使用条件: ①数据要成对,一般大于30对(文中例子是不够的,只是说明关系和计算方法)。 ②两个变量的总体都是正态分布,至少是单峰对称的,样本的分布并不一定要求正态。 ③ 两个变量都是连续变量,也即两列变量是测量数据 ④两个变量的关系是直线性的。 二、计算积差相关系数的基本公式 (一)定义公式 r = X 和 Y 共同变化的程度 X 和 Y各自变化的程度 = X 和 Y的协方差 X 和 Y 各自的标准差 在概念上是什么意思? 协方差 协方差是两个变量的离均差乘积和的平均数, 公式为 它能反映两个变量的一致性,但是不能直接用来表示两个变量的一致性,因为它是带有具体单位的绝对数量,不能与单位不同的资料比较,比如它的绝对值大不见得相关关系就强,为了克服这个缺点就用各自的标准差去除其离差,使其成为没有单位的标准分数,然后将两标准分数的乘积和除以N. 定义公式 (二)计算积差相关的差法计算公式 1、减差法 1、加差法 第三节 等级相关 等级相关是指以等级次序排列或以等级次序表示的变量之间的相关主要包括斯皮尔曼二列等级相关和肯德尔和谐系数多列等级相关。 一、斯皮尔曼等级相关 (一)适用范围 1、是两列等级变量性质数据 2、两者具有线性关系 3、总体分布可以不是正态, 4、样本容量可以是小于30个。 它可以算是皮尔逊相关的特殊形式,如果符合积差相关条件的数据使用斯皮尔曼等级相关的话,会降低精确度。 (二)计算公式 1、一般计算公式 2有相同等级时候计算方法 二、肯德尔等级相关 (一)适用范围,当多个变量值以等级次序表示,求这几个变量间的相关系数,我们常用肯德尔和谐系数来表示,或者称肯德尔W系数 (二)公式计算 1、无相同等级的情况 当同一位评定者对所有被评事物的评定没有相同等级的时候,计算公式为 Ri 表示K个评定者对同一事物给出的等级之和,SSR为R的离差平方和,K代表等级评定者的数目,N表示被评事物的个数。评分者越是高度一致,被评价者的等级和(Ri)的 离散程度( SSR)就越大,而公式的分母部分就是它的极大值 rw值的分布范围与意义 rw的值界于0到1 之间 Rw 不是标准的相关系数。但可以看成是所以可能评定者对评定等级的Spearman相关

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档