多元线形回归分析.docVIP

多元线形回归分析.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元线形回归分析

第十一章 多元相关与回归分析 第一节 多元线性回归模型 多元线性回归即多个自变量对一个因变量的线性回归。 一、多元线性回归模型概念 以两个自变量的二元回归为例,如X1、X2和Y的关系存在关系式:E(Y) =α+β1X1+β2X2,则Y与X1和X2之间存在多元线性相关关系,这一方程即多元线性回归模型。 多元线性回归是多维空间中的超平面,如二元回归是三维空间中的一个平面。对于任意的 (X1, X2),Y的期望值就是该平面上正对(X1, X2)的那个点的Y轴值,其与实际观测点之间存在随机误差,实际观测点Yi=α+β1X1+β2 X2+εi。 二、模型的建立 总体未知情况下,以样本构造出一个平面来估计总体真实平面,即以平面?= a+b1x1+ b2x2去拟合原始观测数据。 拟合的准则是最小二乘法原理,使各观测值距离拟合值的偏差平方和最小,即∑(yi-?)2最小。由此计算出的a,b1, b2是对α, β1, β2的最佳估计。例如对施肥量X1、降雨量X2和产量Y的数据,SPSS输出结果(表1): Variable B SE.B Beta T X1 3.81 0.583 0.59 6.532 X2 3.33 0.617 0.49 5.4 Constant 266.7 32.077 8.313 即得到?= 266.7+3.81x1+3.33x2 三、回归系数的意义 对于模型?= a+b1x1+ b2x2,b1可以解释为:当X2不变的情况下,X1每变化一个单位,Y将平均发生b1个单位的变化。 如果所有自变量都同时变化,那么ΔY= b1ΔX1+ b2ΔX2+…. biΔXi。 例题:如果对产量、施肥量、降雨量做出了简单回归和多元回归模型: A模型:产量=287+5.9施肥量;B模型:产量=400+6.0降雨量; C模型:产量=267+3.81施肥量+3.33降雨量; 请计算:(1)如果在每亩土地上多施10斤肥料,可以期望产量增加多少? (2)如果在每亩土地上多灌溉5厘米的水,可以期望产量增加多少? (3)如果同时在每亩土地上多施10斤肥料,并且多灌溉5厘米的水,可以期望产量增加多少? (4)由原始数据发现较高的施肥量和较高的降雨量是有联系的,如果照这样的趋势下去,那么在每亩土地上多灌溉5厘米的水,可以期望产量增加多少? 解:(1)ΔY=3.81(10)=38.1斤。 (2)ΔY=3.33(5)=16.65斤。 (3)ΔY=3.81(10)+ 3.33(5)= 38. 1+16.65=54.75斤 (4)ΔY=6.0(5)=30斤。采用B模型中的简单回归系数6.0,它表示当施肥量也变化时,产量怎样随着降雨量的变化而变化。 比较题2和题4,30斤的增产不只归功于降雨量,也包含施肥量的影响;而16.65斤的增产则是在施肥量不变的情况下,伴随着降雨量的增加而产生的。 四、自变量为定类变量时回归系数的解释 线形回归要求自变量和因变量都是定距变量,但当自变量为二项变量或定类变量时,可以将其转化为0-1变量/虚拟变量后再进行回归。 1、自变量为二项变量时:如研究存款额Y(百元)和年龄X1、性别X2之间的关系,令男性=1,女性=0(对照组)。如果得到如下多元回归方程:?= 33+12x1-9.1x2,则x2的回归系数-9.1表示,对于同年龄的人来说,男性的存款额比女性平均减少910元。 2、自变量为定类变量时:如研究收入Y(百元)和文化程度X之间的关系,假设文化程度包括小学、中学、大学,可将文化程度转化为两个虚拟变量, D1= D2= ,D1=D2=0代表小学程度(对照组),D1=1,D2=0表示中学文化程度;D1=0,D2=1表示大学文化程度。假如得到回归方程?= 33+12D1+30D2,D1的回归系数表示中学文化程度的人比小学文化程度的人收入平均多1200元;D2的回归系数表示大学文化程度的人比小学文化程度的人收入平均多3000元。 3、如果自变量为连续变量,但其与因变量的关系并不是线形关系,例如年龄X和身高Y的关系,可以把年龄划分成年龄段做为定类变量。对于有个水平的定类变量,需要设计n-1个虚拟变量来描述。 第二节 多元线性回归模型检验 一、回归系数的估计和检验 在多元回归中,各个回归系数的估计值b1,b2…都围绕总体回归系数β1,β2…近似正态波动,所以可以用样本回归系数的标准误差来构造总体回归系数的置信区间。标准误差为表1中的第二列输出结果SE.B。 总体回归系数置信区间公式:βi= bi±tα/2SEi, 其中,i=1,2,….k;查t分布表时的自由度为n-k-1。 例题:以表1为例,计算每个回归系数的95%的置信区间(k=1,2),已知n=7: 解:df=7-2-1=4;查表得t0.0

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档