统计学课件第七章 相关与回归分析4-5.pptVIP

统计学课件第七章 相关与回归分析4-5.ppt

  1. 1、本文档共102页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

注意:这里将样本回归线看成总体回归线的近似替代则:为E(Y|Xi)的估计量bi为Bi的估计量,i=0,1一元线性回归模型

(概念要点)对于只涉及一个自变量的简单线性回归模型可表示为Yi=b0+b1Xi+Ui模型中,Y是X的线性函数(部分)加上误差项线性部分反映了由于X的变化而引起的Y的变化误差项Ui是随机变量反映了除X和Y之间的线性关系之外的随机因素对Y的影响是不能由X和Y之间的线性关系所解释的变异性?0和?1称为模型的参数7-*样本回归函数与总体回归函数区别1.总体回归线是未知的,只有一条。样本回归线是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归线。2.总体回归函数中的β0和β1是未知的参数,表现为常数。而样本回归函数中的是随机变量,其具体数值随所抽取的样本观测值不同而变动。3.总体回归函数中的Ui是Yi与未知的总体回归线之间的纵向距离,它是不可直接观测的。而样本回归函数中的ei是Yi与样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可以计算出ei的具体数值。7-*(三)误差项的基本标准假定误差项Ui是一个期望值为0的随机变量,即E(Ui)=0。对于一个给定的X值,Y的期望值为E(Yi|Xi)=?0+?1Xi对于所有的X值,Ui的方差σ2都相同误差项Ui是一个服从正态分布的随机变量,且相互独立。即U~N(0,σ2)独立性意味着对于一个特定的X值,它所对应的U与其他X值所对应的U不相关对于一个特定的X值,它所对应的Yi值与其他Xi所对应的Y值也不相关7-*总体回归线与随机误差项7-*E(Yt)=β0+β1XtXYtY。。。。。ut(四)回归方程(概念要点)描述Y的条件平均值或期望值如何依赖于X的方程称为回归方程。简单线性回归方程的形式如下E(Y|Xi)=?0+?1Xi7-*方程的图示是一条直线,因此也称为直线回归方程?0是回归直线在Y轴上的截距,是当X=0时Y的期望值?1是直线的斜率,称为回归系数,表示当X每变动一个单位时,Y的平均变动值估计(经验)的回归方程7-*简单线性回归中估计的回归方程为其中:是估计的回归直线在Y轴上的截距,是直线的斜率,它表示对于一个给定的X的值,是Y的估计值,也表示X每变动一个单位时,Y的平均变动值。用样本统计量和代替回归方程中的未知参数和,就得到了估计的回归方程。总体回归参数和是未知的,必需利用样本数据去估计三、参数?0和?1的最小二乘估计(一)最小二乘法

(概念要点)7-*使因变量的观察值与估计值之间的离差平方和达到最小来求得和的方法。即用最小二乘法拟合的直线来代表X与Y之间的关系与实际数据的误差比其他任何直线都小。最小二乘法(图示)7-*XY(Xn,Yn)(X1,Y1)?????????(X2,Y2)(Xi,Yi)}ei=Yi-Yi^3.回归系数的估计的最小二乘法公式设将Q对求偏导数,并令其等于零,可得:加以整理后有:7-*最小二乘法

(和的计算公式)7-*?解方程组可得求解和的标准方程如下:例:现以前例的资料配合回归直线,计算如下:7-*7-*7-*上式中表示人口增加量每增加(或减少)1千人,该种食品的年需求量平均来说增加(或减少)0.5301十吨即5.301吨。估计方程的求法

(Excel的输出结果)7-*(二)估计标准误差SY实际观察值与回归估计值离差平方和的均方根。反映实际观察值在回归直线周围的分散状况。从另一个角度说明了回归直线的拟合程度。计算公式为7-*由样本资料计算由总体资料计算或在大样本情况下7-*计算例子7-*7-*样本相关系数的定义公式实质7-*(二)相关系数的特点1.r的取值介于-1与1之间,r的取值范围是[-1,1]2.在大多数情况下,0<|r|<1,即X与Y的样本观测值之间存在着一定的线性关系,当r>0时,X与Y为正相关,当r<0时,X与Y为负相关。|r|的数值愈接近于1,表示x与y直线相关

文档评论(0)

趁早学习 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档