8.2 一元线性回归模型及其应用 -(选择性必修第二、三册) (教师版) .docxVIP

8.2 一元线性回归模型及其应用 -(选择性必修第二、三册) (教师版) .docx

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

一元线性回归模型及其应用

1一元线性回归模型

用x表示父亲身高,Y表示儿子身高,e表示随机误差,假定随机误差e的均值为0,方差为与父亲身高无关的定值σ2

Y=bx+a+e

我们称它为Y关于x的一元线性回归模型.

2线性回归方程

对于变量x和变量y,设经过随机抽样获得的成对样本数据为x1,y1,x2,y

b

我们将y=bx+a称为

备注线性回归直线经过定点(x

3残差分析

通过观测得到的数据称为观测值,通过经验回归方程得到的y称为预测量,观测值减去预测值称为残差,残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判定原始数据是否存在可疑数据,这方面的工作称为残差分析.

通过观察残差图可以直观判断模型是否满足一元线性回归模型中对随机误差的假设,那残差应是均值为0,方差为σ2

4比较模型的拟合效果

(i)残差平方和

残差平方和Q=i=1

(ii)相关指数R

R

R2越大,残差平方和i=1

【题型一】一元线性回归模型

【典题1】某服装品牌市场部门为了研究销售情况,统计了一段时间内该品牌不同服装的单价x(元)和销售额y(元)的数据,整理得到下面的散点图:

已知销售额y=单价x×销量z,根据散点图,下面四个回归方程类型中最适宜作为服装销量z与单价x的回归方程类型的是()

A.z=a+bx B.z=a+bx C.z=a+bx

【解析】由散点图知,销售额y与单价x呈线性关系,不妨设y=m+nx,

所以z=yx=m+nx

故选:B.

【典题2】已知由样本数据(xi,yi)(i=1,2,3,…,8)组成的一个样本,得到回归直线方程为y=2x?0.4且x

A.相关变量x,y具有正相关关系

B.去除歧义点后的回归直线方程为y=3x?3.2

C.去除歧义点后,随x值增加相关变量y值增加速度变小

D.去除歧义点后,样本(4,8.9)的残差为0.1(附:e1=y1

【解析】对选项A、B:

由x=2,代入y=2x?0.4,得

(样本中心(x,y)一定在线性回归方程y=

∴去除两个歧义点(?2,7)和(2,?7)后,得到新的x=2×8?2+26

又得到新的回归直线的斜率为3,

∴新的线性回归方程的a=4.8?3×

则去除两个歧义点后的线性回归方程为y=3x?3.2,故B

(求出新的样本中心(x,y),再利用其一定在线性回归方程y=b

又由斜率30,相关变量x,y具有正相关关系,故A正确;

对选项C:

原本回归直线方程y=2x?0.4中x增加1则y增加2,去除歧义点后,回归直线方程y=3x?3.2中x增加1则y增加3,故去除歧义点后,随x值增加相关变量y值增加速度变大,故

对选项D:

当x=4时,y=3×4?3.2=8.8,则去除歧义点后,样本(4,8.9)的残差为8.9?8.8=0.1,故D

故选:ABD.

【典题3】2020年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区2019年12月至2020年12月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码1~13分别对应2019年12月~2020年12月)

根据散点图选择y=a+bx和y=c+dlnx两个模型进行拟合,经过数据处理得到的两个回归方程分别为y=0.9369+0.0285x

y=0.9369+0.0285

y=0.9554+0.0306lnx

R

0.923

0.973

注:x是样本数据中x的平均数,y是样本数据中y的平均数,则下列说法正确的是()

A.当月在售二手房均价y与月份代码x呈负相关关系

B.由y=0.9369+0.0285x预测2021年3月在售二手房均价约为

C.曲线y=0.9369+0.0285x与y=0.9554+0.0306lnx都经过点(x,

D.模型y=0.9554+0.0306lnx回归曲线的拟合效果比模型y

【解析】由散点图可知,y随x的增加而增加,故A错误;

2021年3月,相对2019年12月为x=1,此时x=16,代入y=0.9369+0.0285x,求得1.0509,故

(在实际应用中要注意理解变量x、

曲线y=0.9369+0.0285x经过点(x,y),曲线

(样本中心(x,y)一定在线性回归方程y=bx+

因为0.9730.923,所以模型y=0.9554+0.0306lnx回归曲线的拟合效果比模型y=0.9369+0.0285x

(R2

故选:BD.

巩固练习

1(★)某校课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,由实验数据得到右面的散点图.由此散点图,最适宜作为发芽率y和温度x的回归方程类型的是(

您可能关注的文档

文档评论(0)

134****3617 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档