- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
PAGE8/NUMPAGES8
第三节成对数据的统计分析
第1课时变量间的相关关系及回归模型
课程目标
课程目标
1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.
2.结合实例,会通过相关系数比较多组成对数据的相关性.
3.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法.
4.针对实际问题,会用一元线性回归模型进行预测.
基础知识
基础知识
1.变量的相关关系
(1)相关关系:若两个变量之间有关系,但又不是函数关系,这种关系称为相关关系;
(2)相关关系的分类:①从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,就称这两个变量;
②当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量;
提醒注意相关关系与函数关系的区别:函数关系是一种确定的关系,而相关关系是一种非确定的关系.(3)线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在附近,就称这两个变量线性相关.
2.样本相关系数
对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(xn,yn),若x与y存在线性相关关系,可用样本相关系数r定量分析它们的相关程度的强弱.
(1)样本相关系数
r=∑i
(2)样本相关系数r的性质
①当r>0时,称成对样本数据相关;当r<0时,称成对样本数据相关;当r=0时,称成对样本数据间没有线性相关关系;
②样本相关系数r的取值范围为.当|r|越接近1时,成对样本数据的线性相关程度越;当|r|越接近0时,成对样本数据的线性相关程度越.
3.一元线性回归模型
(1)经验回归直线:从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做经验回归直线;
(2)经验回归方程为y=bx+a,其中b=∑i=1n(xi-x)(
(3)通过求Q=∑i=1n(yi-bxi-a)2的最小值而得到经验回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小
4.判断回归模型的拟合效果
由成对样本数据(xi,yi)(i=1,2,…,n)按照最小二乘法得到经验回归方程y=bx+a,其中y叫做观测值,y叫做预测值,残差e=y-y.相对于样本点(xi,yi)的随机误差ei=yi-yi=yi-(bxi+a
(1)残差分析法
①作残差图:作图时纵坐标为,横坐标可以选为样本编号,或xi数据,或yi数据,这样作出的图形称为残差图;
②残差分析:残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预报精度越高.
(2)决定系数(R2)法:R2=1-∑i=1n(yi-y
基础自测
基础自测
1.判断正误.(正确的画“√”,错误的画“×”)
(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.()
(2)散点图是判断两个变量相关关系的一种重要方法和手段.()
(3)经验回归直线y=bx+a至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.()
(4)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.()
2.两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分别反映的变量间的相关关系是()
A.①②③ B.②③①
C.②①③ D.①③②
3.对于x,y两变量,有四组成对样本数据,分别算出它们的样本相关系数r如下,则线性相关性最强的是()
A.-0.82 B.0.78
C.-0.69 D.-0.87
4.在对两个变量x,y进行回归分析时有下列步骤:①对所求出的经验回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求经验回归方程;④根据所收集的数据绘制散点图.则下列操作顺序正确的是()
A.①②④③ B.③②④①
C.②③①④ D.②④③①
5.已知x,y的取值如下表,已知y与x具有线性相关关系,且经验回归方程为y=0.95x+a,则a=.
x
0
1
3
4
y
2.2
4.3
4.8
6.7
聚焦考点课堂演练
聚焦考点课堂演练
考点1变量间相关关系的判断
考点1变量间相关关系的判断
性
【例1】(1)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
月份
1
2
3
4
5
6
人均销售额
6
5
8
3
4
7
利润率(%)
12.6
10.4
18.5
3.0
8.1
16.3
根据
文档评论(0)