- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
成对数据的统计相关性
1 相关关系与确定关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
比如 正方形面积与边长,高一定时圆锥的体积与底圆半径等均为确定关系;体重与身高,子女的身高与父亲的身高,空气污染指数与汽车保有量等均为相关关系.
2 正相关与负相关
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,称这两个变量正相关;从散点图来看,点从左下角往右上角走.
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现减少的趋势,称这两个变量负相关;从散点图来看,点从左上角往右下角走.
比如脂肪含量与年龄 , 子女的身高与父亲的身高正相关.
3 线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
4 样本相关系数
对于变量x和变量y,设经过随机抽样获得的成对样本数据为x1 , y1 , x2 , y
r=
我们称r为变量x和变量y的样本相关系数.
① 当r>0时,称成对数据正相关;当r<0时,称成对数据负相关.
② |r|越接近于1,两个变量的线性相关性越强;
|r|接近于0时,两个变量之间几乎不存在线性相关关系.
③ 样本相关系数r也可以推导得到
r=
【题型一】 相关关系与确定关系
【典题1】下面哪两个变量间是相关关系( )
A.出租车费与行驶的里程 B.房屋面积与房屋价格
C.身高与体重 D.铁块的大小与质量
【解析】根据题意,依次分析选项:
对于A,出租车费与行驶的里程之间的关系是确定,是函数关系,不符合题意;
对于B,房屋面积与房屋价格之间的关系是确定,是函数关系,不符合题意;
对于C,身高与体重之间的关系是不确定,但在一定范围内,身高越高,体重越大,是相关关系,符合题意;
对于D,铁块的大小与质量之间的关系是确定,是函数关系,不符合题意;
故选:C.
【点拨】是确定关系还是相关关系,看两变量之间关系是否确定的.
【题型二】正相关与负相关
【典题1】有以下五组变量:
①某商品的销售价格与销售量;
②学生的学籍号与学生的数学成绩;
③坚持每天吃早餐的人数与患胃病的人数;
④气温与冷饮销售量;
⑤电瓶车的重量和行驶每千米的耗电量.
其中两个变量成正相关的是( )
A.①③ B.②④ C.②⑤ D.④⑤
【解析】对于①,一般情况下,某商品的销售价格与销售量成负相关关系;
对于②,学生的学籍号与学生的数学成绩没有相关关系;
对于③,一般情况下,坚持每天吃早餐的人数与患胃病的人数成负相关关系;
对于④,一般情况下,气温与冷饮销售量成正相关关系;
对于⑤,一般情况下,电瓶车的重量和行驶每千米的耗电量成正相关关系.
综上所述,其中两个变量成正相关的序号是④⑤.
故选:D.
【点拨】如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,称这两个变量正相关;如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现减少的趋势,称这两个变量负相关.
【典题2】在各散点图中,两个变量具有正相关关系的是( )
A. B.
C. D.
【解析】根据题意,依次分析选项为:
对于A、是相关关系,但不是正相关关系,不符合题意;
对于B、是相关关系,也是正相关关系,符合题意;
对于C、是相关关系,是负相关关系,不符合题意;
对于D、所示的散点图中,样本点不成带状分布,这两个变量不具有线性相关关系,不符合题意.
故选:B.
【点拨】从散点图来看,点从左下角往右上角走是正相关;从散点图来看,点从左上角往右下角走是负相关.
【题型三】成对数据的统计相关系数
【典题1】对某统计部门对四组数据进行统计分析后,获得如图所示的散点图,关于相关系数的比较,其中正确的是( )
A.r4<r2
C.r2<r
【解析】根据散点图的特征,数据大致呈增长趋势的是正相关,数据呈递减趋势的是负相关;由题中数据可知:(1)(3)为正相关,(2)(4)为负相关;
数据越集中在一条线附近,说明相关性越强,
故r1
又(1)与(2)中散点图更接近于一条直线,故r1
因此,r2
故选:C.
【点拨】
① 若散点图中数据集中所在的直线斜率为正,则正相关;斜率为负,则负相关.
② 数据越集中在一条线附近,说明相关性越强;与该直线的斜率大小无关.
【典题2】如图所示,5个(x , y)数据,去掉D(3 , 10)后,下列说法正确的是( )
A.相关系数r变大 B.残差平方和变大
C.相关指数R2变小 D.解释变量x与预报变量y
【解析】由散点图知,去掉离群点D后,x与y的相关性变强,且为正相关,
您可能关注的文档
- (人教A版必修第一册)5.7函数y=Asin(ωx+φ)的图像和性质-(教师版).docx
- (人教A版选择性必修第二、三册)5.1导数的概念及其运算-(学生版).docx
- (人教A版选择性必修第二、三册)6.3二项式定理-(学生版).docx
- (人教A版选择性必修第二、三册)7.2-7.3离散型随机变量-(学生版).docx
- (人教A版选择性必修第二、三册)8.2一元线性回归模型及其应用-(教师版).docx
- (人教A版选择性必修第二、三册)专题2导数中的二次求导-(学生版).docx
- 人教版地理七年级(上册)教学计划+进度表.docx
- 人教版生物八年级(上册)教学计划+进度表.docx
- 数列知识梳理知识清单-2024届高三数学一轮复习.docx
- 公开课教案教学设计课件鄂教初中语文七下《外星人(节选)》PPT课件.ppt
文档评论(0)