[基础科学]直线回归分析-研.ppt

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[基础科学]直线回归分析-研

表2 12只大白鼠的进食量与体重增加量 医学上,许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等。 回归的由来 英国统计学家Pearson K(1857~1936)1903年搜集了1078个家庭人员的身高、前臂长等指标的记录,发现儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系: 回归的由来 表明:高个子父亲儿子的平均身高稍矮于其父亲的平均身高;而矮个子父亲儿子的平均身高稍高于其父亲的平均身高。英国人类学家Galton F(1822~1911)将这种趋向于种族稳定的现象称之为“回归”。至此,“回归”逐渐发展成为分析两个变量或多个变量之间某种数量依存关系的一类统计方法。 一、直线回归的概念 例12.1(P165):为探讨某地饮水中氟含量与氟骨症的关系,试对测量得到的下列8对数据进行直线回归分析。 图12-1 某地区饮水氟含量与氟骨症患病率散点图 二、直线回归方程 直线回归方程: 回归系数与截距的计算: 应用数学上的最小二乘法原理 例:12.1 P167 1、绘制散点图: (直线回归的条件:“LINE”) 计算 3、列出回归方程: 三、回归系数的假设检验 方差分析法 t检验法 回归系数的假设检验:方差分析法 方差分析的基本思想: 把总的离均差平方和(即总变异)分解为至少两个部分,其中有一部分主要表示某因素的效应,有一部分表示随机误差的影响,然后比较两者的均方,计算F值,若F值远大于1,可认为该因素有效应,否则认为该因素无效应。 应变量Y的离均差平方和的分解 SS总 = SS回 + SS剩 回归系数的方差分析 SS总 =lYY SS回 =blXY =lXY2/lXX SS剩= SS总- SS回= lYY - lXY2/lXX 例:用方差分析法对例12.1数据求得的回归系数进行假设检验 b=6.43 回归系数方差分析的基本步骤: H0:β=0(饮水中氟含量与氟骨症之间没有直线关系) H1:β≠0(饮水中氟含量与氟骨症之间有直线关系) α= 0.05 计算统计量: SS总 =lYY =718.03 SS回 =blXY =lXY2/lXX =626.11 SS剩= SS总- SS回= lYY - lXY2/lXX =91.92 回归系数方差分析的基本步骤: 确定P值:?回=1 ?剩=6,查F界值表得P0.01 下结论:按?=0.05的检验水准,拒绝H0,接受H1,可认为饮水中氟含量与氟骨症之间有直线关系。 回归系数的假设检验: t检验法 例:用t检验法对饮水中氟含量与氟骨症之间的直线回归系数进行假设检验 H0:β=0 H1:β≠0 α= 0.05 n=8 SS剩= 91.97 lxx=15.15, b=6.43 SYX=…=3.92 Sb=…=1.01 t = …=6.37 方差分析和t检验的关系: 按?=6,查t界值表得P0.001,按?=0.05的检验水准,拒绝H0,接受H1 ,可认为饮水中氟含量与氟骨症之间有直线关系。 四、直线回归方程的图示 在自变量X的实测范围内任取相距较远且易读数的两X值代入回归方程求得两点坐标、连线即得其回归直线。 五、回归系数与预测值的区间估计 预测:把易测量的预报因子(自变量x)代入回归方程对不易测量的预报量(应变量y)进行点估计和区间估计。 (一)回归系数的可信区间 (b - t?/2,? sb ,b + t?/2,? sb) 或 b ? t?/2,? sb ?= n - 2 例: (续前例)试求总体回归系数β的95%可信区间 b=6.43 ,?=8-2=6, t0.05/2,6 =2.447, Sb=1.01 β的95%可信区间为: (6.43-2.447×1.01,6.43+2.447×1.01) =(3.96,8.90) (二) 可信区间 :是总体中x取某定值X0时 的总体均数 例: (续前例)试计算当x0=1.00时 的95%可信区间 x0=1.00时 =24.72 SYX=3.92 lxx=15.15,?X=2.00 (三)个体Y值的容许区间 个体Y值的容许区间:总体中x为某定值X0时,Y值由于随机误差影响在 上下波动的范围。 例:(续前例)试计算当x0=1.00时个体Y值的95%容许区间 剩余标准差 x取某定值x0时应变量y的标准差 五 直线回归方程的应用 (一)直线回归方程的主要用途 1、定量描述两变量间的依存关系 2、利用回归方程进行预测 3、利用回归方程进行统计控制 (二)直线回归应用的注意事

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档