线性回归分析.pptVIP

  1. 1、本文档共210页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
回归分析 (Correlation & regression);线性回归; ;回归分析一般步骤: 确定回归方程中的解释变量(自变量)和被解释变量(因变量) 确定回归模型 建立回归方程 对回归方程进行各种检验 利用回归方程进行预测 ;线性回归模型 一元线性回归模型是指只有一个解释变量的线性回归模型,用于揭示被解释变量与另一个解释变量之间的线性关系。 一元线性回归数学模型: 其中β0和β1是未知参数,分别称为回归常数和回归系数,ε称为随机误差,是一个随机变量,且应该满足两个前提条件: E(ε)=0 var(ε)=σ2;多元线性回归模型是指有多个解释变量的线性回归模型,用于揭示被解释变量与其他多个解释变量之间的线性关系。 多元线性回归数学模型: 其中β0、β1、… βp都是未知参数,分别称为回归常数和偏回归系数,ε称为随机误差,是一个随机变量,且同样满足两个前提条件: E(ε)=0 var(ε)=σ2;回归参数的普通最小二乘估计(OLSE) 线性回归方程确定后的任务是利用已经收集到的样本数据,根据一定的统计拟合准则,对方程中的各参数进行估计。普通最小二乘就是一种最为常见的统计拟合准则。 最小二乘法将偏差距离定义为离差平方和,即 最小二乘估计就是寻找参数β0 、β1、… βp的估计值β?0 、β ?1、… β ?p,使式(1)达到极小。通过求极值原理(偏导为零)和解方程组,可求得估计值,SPSS将自动完成。;回归方程的统计检验 回归方程的拟合优度检验(相关系数检验) 一元线性回归的拟合优度检验采用R2统计量,称为判定系数或决定系数,数学定义为;回归方程的统计检验 回归方程的拟合优度检验(相关系数检验) R2取值在0-1之间, R2越接近于1,说明回归方程对样本数据点的拟合优度越高。;多元线性回归的拟合优度检验采用 统计量,称为调整的判定系数或调整的决定系数,数学定义为;回归方程的统计检验 回归方程的显著性检验(F检验);回归方程的统计检验 回归方程的显著性检验(F检验);回归方程的统计检验 回归系数的显著性检验(t检验);回归方程的统计检验 回归系数???显著性检验(t检验);回归方程的统计检验 残差分析;回归方程的统计检验 残差分析——均值为0的正态性分析;回归方程的统计检验 残差分析——独立性分析 绘制残差序列的序列图 以样本期(或时间)为横坐标,残差为纵坐标,如果残差随时间的推移呈规律性变化,则存在一定的正或负相关性。 计算残差的自相关系数 取值在-1到+1之间,接近于+1表明序列存在正自相关性。 DW(Durbin—Watson)检验 DW取值在0至4之间,直观判断标准是DW=4,残差序列完全负自相关;DW=2,完全无自相关;DW=0,完全正自相关。;回归方程的统计检验 残差分析——异方差分析 绘制残差图 如果残差的方差随着解释变量值的增加呈增加(或减少)的趋势,说明出现了异方差现象。;回归方程的统计检验 残差分析——异方差分析 等级相关分析 得到残差序列后首先对其取绝对值,然后计算出残差和解释变量的秩,最后计算Spearman等级相关系数,并进行等级相关分析。具体过程见相关分析相关章节。;回归方程的统计检验 残差分析——探测样本中的异常值和强影响点(对于y值) 标准化残差ZRE 由于残差是服从均值为0的正态分布,因此可以根据3σ准则 进行判断,首先对残差进行标准化 ,绝对值大于3对应的观察值为异常值。 学生化残差SRE 剔除残差DRE(或剔除学生化残差SDRE) 上述SRE、SDRE的直观判断标准同标准化残差ZRE。;回归方程的统计检验 残差分析——探测样本中的异常值和强影响点(对于x值) 杠杆值hii SPSS中计算的是中心化杠杆值chii,通常如果chii大于2或3倍的chii的均值(p/n),则认为观察点为强影响点。 库克距离Di 库克距离是杠杆值与残差大小的综合效应,一般库克距离大于1,则可认为观察点为强影响点。 标准化回归系数的变化和标准化预测值的变化 如果标准化回归系数变化的绝对值大于 ,或标准化预测值变化的绝对值大于 ,则可认为第i个样本可能是强影响点。 ;多元回归分析中的其他问题 变量筛选问题 向前筛选策略 解释变量不断进入回归方程的过程,首先选择与被解释变量具有最高线性相关系数的变量进入方程,并进行各种检验;其次在剩余的变量中挑选与解释变量偏相关系数最高并通过检验的变量进入回归方程。 向后筛选策略 变量不断剔除出回归方程的过程,首先

文档评论(0)

movie + 关注
实名认证
文档贡献者

喜欢分享的作者

1亿VIP精品文档

相关文档