C17受限因变量模型和样本选择纠正..docx

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
C17受限因变量模型和样本选择纠正.

第17章 受限因变量模型和样本选择纠正摘要: C7中的线性概率模型是受限因变量(limited dependent variable (LDV))模型的一例子,其容易解释,但有其缺陷,本章介绍的logit模型和probit模型更为常用,但解释相对困难。实际应用中,离散和连续是相对的,也就是说,实际离散的经济变量可能也适用于因变量离散的模型建模。本节介绍的模型包括Tobit模型,用于应对角点解响应(corner solution response);泊松回归模型(计数模型),用于建模LDV只能取非负整数的情况;截断数据模型和对样本选择的纠正。 受限因变量模型更容易在横截面数据中被使用。样本选择的纠正通常都源于横截面或面板数据。17.1 二值响应的logit模型和probit模型线性概率模型的缺陷?二值响应模型(binary response model)关注的核心问题是响应概率(response probability):.logit模型和probit模型的设定为此,需要先建一个连接函数:,其中G(.)是一个取值于(0,1)的函数。常见的连接函数有:,该函数是标准logistic随机变量的累积分布函数:常见的连接函数还有标准正态的累积分布函数,G可以被表示为:.使用上述两个连接函数,我们分别建立了logit模型和probit模型。关于logit模型和probit模型的推导:并定义,为示性函数。要求满足CLM假设或高斯-马尔科夫假设。显然当服从均值为0的正态分布,或者logistic分布,其都关于0点对称,则有: ,也即:.从该推导中我们知道,但由于的不可观测性本身的含义并不直观,也并不很有用,虽然和中x的影响方向具有一致性(这一点由下面推导保证)。我们关心解释变量对y的偏效应,由于(.)的非线性,对连续变量的情形就得依赖于偏导技术:,其中为概率密度函数,由于,所以偏效应的方向取决于。 一个有趣的结论是:任意两个自变量的偏效应之比等于其系数之比。此外,偏效应方程告诉我们偏效应依赖于密度函数的位置和的大小,从而logit模型和probit模型的最大偏效应位置出现在和=0.25.而对于二值变量情形,则其偏效应相对来说容易确定,例如,是一个二值变量,则其偏效应为:。其它离散变量情况类似。考虑如下问题的偏效应:.对于上述问题,有时还要考虑响应概率相对于一个解释变量的弹性:对的弹性为:;对的弹性为:;对含解释变量交互项的模型可能会更难处理,可依赖于偏导数讨论。logit和probit模型的极大似然估计极大似然法(maximum likelihood estimation , MLE)是基于条件分布的估计量,故一般其是有效估计和考虑了异方差性。其可用于对受限因变量模型的估计。假定有一个样本量为n的样本,为了得到极大似然估计量,需要给出在给定下的分布函数:对上述方程取自然对数:),对上述方程求和,得到对数似然函数:,则最大化上述函数可求得的MLE估计量,记为,对数似然函数值一般是负值。极大似然估计量一般是一致的、渐近正态的和渐近有效的(Wooldrige,2002,C13)。其标准误和检验统计量一般统计软件都会提供。多重约束性检验有三种常用的排除性约束检验统计量:Lagrange multiplier or score test(Wooldrige,2002,C15);Wald test(Wooldrige,2002,C13) 和likelihood ratio (LR) test。下面介绍似然比检验的思想:如果部分变量的确对y有联合显著性,那么去掉它们,对数似然函数取值应该有比较大的降低,从而可以构造似然比统计量:LR=2(),表示无约束模型的对数似然值,而表示有约束模型的对数似然值,那么在原假设(检验q个排除性约束)成立的情况下,有LR.解释Logit 和Probit模型的估计值拟合优度指标之一:正确预测百分数( percent correctly predicted),若,则定义,若,则定义,该变量是对的预测值,当表示预测对了,否则表示做了不正确的预测,所以只需要计算成立的对数。分类给出正确预测百分比数是更好的选择。关于临界值0.5的争议: 假如,那么可能发生的可能性很小,所以一种替代方法是将临界值定为,但可能在对进行0预测时会犯更大错误。更有效地方法是使用搜索的方法确定临界值,以使正确预测百分比达到最大。拟合优度指标之二:伪(pseudo R-squared)为McFadden(1974)建议的指标1-,表示只有截距项的模型的对数似然值。请解释?拟合优度指标之三:=G()为拟合概率,其也是对的估计值,考察和的相似度!拟合优度本身对经济问题研究是相对次要的,下面讨论相对重要的偏效应(在其它条件不变的情形下的显著关系探讨)。连续情形下,,此

文档评论(0)

dashewan + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档