SPSSAU__二元logit原理剖析.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

SPSSAU数据不一致二元logistic回归原理

二元logistic回归数学原理

目录

1.二元logistic回归模型构建1

2.极大似然法3

3.Newton牛顿迭代法4

4.总结6

1.二元logistic回归模型构建

大家都知道,二元logistic回归时,其实际分析上是研究X对于Y的影响,而且Y

为二分类数据,比如是否愿意购买产品,是否喜欢,是否购买直播带货商品等。数字1

代表YES,数字0代表NO。而且X对于Y的影响时,数学模型可构建如下:

ln⁡()=+++⋯+

01122

1−

上式中,ln⁡()服从二元logistic分布,⁡表示发生的概率,1-⁡表示没有发生的概

1−

率,研究的数据Y只会有数字1和0,所以使用模型构建时,也希望本来原始数据是1,

那么模型拟合出来的预测值也尽最大可能接近1,本来原始数据是0,那么模型拟合出

来的预测值也尽最大可能接近0。而且等号右侧的X1,X2等均为研究的X即影响因素。

代表估计参数,分析上称其为回归系数。如果与SPSSAU结果对应则如下:

本案例数据,可点击下载

数据需要先上传至七牛后得到链接

上述中的回归系数值,即为二元logistic回归需要计算出来的值。那么该值是如何计

算得到的呢?首先:模型等式左边即ln⁡(),表示发生的概率,1-⁡表示没有发生的

1−

概率,研究的数据Y只会有数字1和0,所以使用模型构建时,也希望本来原始数据是

1,那么模型拟合出来的预测值也尽最大可能接近1,本来原始数据是0,那么模型拟合

出来的预测值也尽最大可能接近0。这是可以直接想到的,但如何估计得到呢?

这里使用到了数学上的“极大似然法”原理,即:当前比如有219个样本数据(219

行),那么就有219个Y值,而且219个Y值里面有的是数字1,有的是数字0,比如本

文档使用的数据Y为‘是否购买直播带货’,其中有194个为数字1即购买过直播带货,

25个没有购买过直播带货(数字为0)。既然出来了这样的结果,那么就说明当前这种

情况(194个为yes,25个为no),这种情况并非偶然而一种最大的可能(似想为什么没

有出现比如100个yes和94个no呢?),这种思想就称为“极大似然法”。接下来一部

分将单独讲解“极大似然法”。

2.极大似然法

接着上一部分,共有219个样本数据,对于‘是否购买直播带货’这个Y,其中194

个为yes,25个no。这种情况的产生并非偶然而是基于当前的6个影响因素X,对于Y会

产生影响,因而出现了此种情况(其中194个为yes,25个no)。正是由于6个影响因素

对于‘是否购买直播带货’这个Y的影响,出现当前最大的可能(其中194个为yes,25

个no)。

那么循着当前的“最大似然法”思维,构建出数学公式如下:

1−

=∏⁡(1−)

=1

上式中,i代表219个样本的编号,n=219,i是

文档评论(0)

147****4623 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档