C17受限因变量模型和样本选择纠正..docx

下载文档 降价啦

25
0
约6.07千字
约 19页
2017-01-11 发布于重庆
举报
版权申诉
保障服务

C17受限因变量模型和样本选择纠正..docx

1、本文档共19页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

C17受限因变量模型和样本选择纠正.

第17章受限因变量模型和样本选择纠正摘要: C7中的线性概率模型是受限因变量(limited dependent variable (LDV))模型的一例子，其容易解释，但有其缺陷，本章介绍的logit模型和probit模型更为常用，但解释相对困难。实际应用中，离散和连续是相对的，也就是说，实际离散的经济变量可能也适用于因变量离散的模型建模。本节介绍的模型包括Tobit模型，用于应对角点解响应(corner solution response);泊松回归模型(计数模型)，用于建模LDV只能取非负整数的情况；截断数据模型和对样本选择的纠正。受限因变量模型更容易在横截面数据中被使用。样本选择的纠正通常都源于横截面或面板数据。17.1 二值响应的logit模型和probit模型线性概率模型的缺陷？二值响应模型（binary response model）关注的核心问题是响应概率(response probability):.logit模型和probit模型的设定为此，需要先建一个连接函数：,其中G(.)是一个取值于（0,1）的函数。常见的连接函数有：,该函数是标准logistic随机变量的累积分布函数：常见的连接函数还有标准正态的累积分布函数，G可以被表示为：.使用上述两个连接函数，我们分别建立了logit模型和probit模型。关于logit模型和probit模型的推导：并定义,为示性函数。要求满足CLM假设或高斯-马尔科夫假设。显然当服从均值为0的正态分布，或者logistic分布，其都关于0点对称，则有： ,也即：.从该推导中我们知道，但由于的不可观测性本身的含义并不直观，也并不很有用，虽然和中x的影响方向具有一致性(这一点由下面推导保证)。我们关心解释变量对y的偏效应，由于(.)的非线性，对连续变量的情形就得依赖于偏导技术：,其中为概率密度函数，由于,所以偏效应的方向取决于。一个有趣的结论是：任意两个自变量的偏效应之比等于其系数之比。此外，偏效应方程告诉我们偏效应依赖于密度函数的位置和的大小，从而logit模型和probit模型的最大偏效应位置出现在和=0.25.而对于二值变量情形，则其偏效应相对来说容易确定，例如，是一个二值变量，则其偏效应为：。其它离散变量情况类似。考虑如下问题的偏效应：.对于上述问题，有时还要考虑响应概率相对于一个解释变量的弹性：对的弹性为：;对的弹性为：;对含解释变量交互项的模型可能会更难处理，可依赖于偏导数讨论。logit和probit模型的极大似然估计极大似然法(maximum likelihood estimation , MLE)是基于条件分布的估计量，故一般其是有效估计和考虑了异方差性。其可用于对受限因变量模型的估计。假定有一个样本量为n的样本，为了得到极大似然估计量，需要给出在给定下的分布函数：对上述方程取自然对数：),对上述方程求和，得到对数似然函数：,则最大化上述函数可求得的MLE估计量，记为,对数似然函数值一般是负值。极大似然估计量一般是一致的、渐近正态的和渐近有效的(Wooldrige,2002,C13)。其标准误和检验统计量一般统计软件都会提供。多重约束性检验有三种常用的排除性约束检验统计量：Lagrange multiplier or score test（Wooldrige,2002,C15）；Wald test(Wooldrige,2002,C13）和likelihood ratio (LR) test。下面介绍似然比检验的思想：如果部分变量的确对y有联合显著性，那么去掉它们，对数似然函数取值应该有比较大的降低，从而可以构造似然比统计量：LR=2(),表示无约束模型的对数似然值，而表示有约束模型的对数似然值，那么在原假设(检验q个排除性约束)成立的情况下，有LR.解释Logit 和Probit模型的估计值拟合优度指标之一:正确预测百分数( percent correctly predicted)，若,则定义，若,则定义,该变量是对的预测值，当表示预测对了，否则表示做了不正确的预测，所以只需要计算成立的对数。分类给出正确预测百分比数是更好的选择。关于临界值0.5的争议: 假如，那么可能发生的可能性很小，所以一种替代方法是将临界值定为，但可能在对进行0预测时会犯更大错误。更有效地方法是使用搜索的方法确定临界值，以使正确预测百分比达到最大。拟合优度指标之二:伪(pseudo R-squared)为McFadden(1974)建议的指标1-,表示只有截距项的模型的对数似然值。请解释？拟合优度指标之三:=G()为拟合概率，其也是对的估计值，考察和的相似度！拟合优度本身对经济问题研究是相对次要的，下面讨论相对重要的偏效应（在其它条件不变的情形下的显著关系探讨）。连续情形下，,此