第1课时 变量间的相关关系及回归模型答案.docx

第1课时 变量间的相关关系及回归模型答案.docx

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE

PAGE1/NUMPAGES16

第三节成对数据的统计分析

第1课时变量间的相关关系及回归模型

课程目标

课程目标

1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.

2.结合实例,会通过相关系数比较多组成对数据的相关性.

3.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法.

4.针对实际问题,会用一元线性回归模型进行预测.

基础知识

基础知识

1.变量的相关关系

(1)相关关系:若两个变量之间有关系,但又不是函数关系,这种关系称为相关关系;

(2)相关关系的分类:①从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,就称这两个变量正相关;

②当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关;

提醒注意相关关系与函数关系的区别:函数关系是一种确定的关系,而相关关系是一种非确定的关系.(3)线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,就称这两个变量线性相关.

2.样本相关系数

对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(xn,yn),若x与y存在线性相关关系,可用样本相关系数r定量分析它们的相关程度的强弱.

(1)样本相关系数r=∑i

(2)样本相关系数r的性质

①当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关;当r=0时,称成对样本数据间没有线性相关关系;

②样本相关系数r的取值范围为[-1,1].当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.

3.一元线性回归模型

(1)经验回归直线:从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做经验回归直线;

(2)经验回归方程为y=bx+a,其中b=∑i=1n

a=y-bx

(3)通过求Q=∑i=1n(yi-bxi-a)2的最小值而得到经验回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小

4.判断回归模型的拟合效果

由成对样本数据(xi,yi)(i=1,2,…,n)按照最小二乘法得到经验回归方程y=bx+a,其中y叫做观测值,y叫做预测值,残差e=y-y.相对于样本点(xi,yi)的随机误差ei=yi-yi=yi-(bxi+a

(1)残差分析法

①作残差图:作图时纵坐标为残差,横坐标可以选为样本编号,或xi数据,或yi数据,这样作出的图形称为残差图;

②残差分析:残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预报精度越高.

(2)决定系数(R2)法:R2=1-∑i=1n(yi-y

基础自测

基础自测

1.判断正误.(正确的画“√”,错误的画“×”)

(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.(√)

(2)散点图是判断两个变量相关关系的一种重要方法和手段.(√)

(3)经验回归直线y=bx+a至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.(×)

(4)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.(√)

2.两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分别反映的变量间的相关关系是()

A.①②③ B.②③①

C.②①③ D.①③②

解析:D第一个散点图中的点是从左下角区域分布到右上角区域,则是正相关;第三个散点图中的点是从左上角区域分布到右下角区域,则是负相关;第二个散点图中的点的分布没有什么规律,则是不相关,所以应该是①③②.

3.对于x,y两变量,有四组成对样本数据,分别算出它们的样本相关系数r如下,则线性相关性最强的是()

A.-0.82 B.0.78

C.-0.69 D.-0.87

解析:D由样本相关系数的绝对值越大,变量间的线性相关性越强知,各选项中r=-0.87的绝对值最大.

4.在对两个变量x,y进行回归分析时有下列步骤:①对所求出的经验回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求经验回归方程;④根据所收集的数据绘制散点图.则下列操作顺序正确的是()

A.①②④③ B.③②④①

C.②③①④ D.②④③①

解析:D根据回归分析的思想,可知对两个变量x,y进行回归分析时,应先收集数据(xi,yi),然后绘制散点图,再求经验回归方程,最后对所求的经验

文档评论(0)

教辅之家 + 关注
实名认证
内容提供者

教师资格证持证人

法律书籍、案列评析、合同PDF、医学电子书、教学设计、课件、钢琴谱。

领域认证该用户于2024年02月15日上传了教师资格证

1亿VIP精品文档

相关文档