分位数回归区间估计方法比较分析.docx

分位数回归区间估计方法比较分析.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
? ? 分位数回归区间估计方法比较分析 ? ? 袁晓惠, 鞠婷婷, 陈 晶 (长春工业大学 基础科学学院, 吉林 长春 130012) ? 分位数回归区间估计方法比较分析 袁晓惠, 鞠婷婷, 陈 晶 (长春工业大学 基础科学学院, 吉林 长春 130012) 介绍了分位数回归模型参数的3类区间估计方法,分别为直接法、自助法、诱导光滑法,通过模拟比较他们在覆盖率与置信区间长度方面的表现。 分位数回归; 诱导光滑; 自助法 0 引 言 线性回归模型是统计学中最经典的模型。传统的线性回归研究因变量的条件均值随自变量的变化趋势。此类模型对随机误差的分布有较强的假定。Koenker和Bassett[1]于1978年提出线性分位数回归,考虑因变量的条件分位数对自变量的影响,可以根据不同的条件分位数更全面地认识因变量的条件分布。与传统的线性回归相比,分位数回归模型使用范围更广,估计效果更准确。随着计算机技术的发展,分位数回归模型在经济、金融、生物医学、数据挖掘、环境科学等方面得到广泛应用[2-3]。 分位数回归模型的目标函数是非光滑的,其参数的估计存在一定的困难。针对分位数回归模型参数的区间估计问题,比较流行的有4类方法: 1)直接法。根据参数估计的渐近正态性,运用样本信息直接估计渐近方差中的未知量并构造置信区间。 2)秩得分法。根据秩检验统计量的反演运算构造置信区间。此方法易于理解,计算简单,但是计算速度较慢,尤其在处理大型多维数据时,此算法运行缓慢。 3)自助法[4]。基于重复抽样技术构造回归参数的置信区间。 4)诱导光滑法[5-6]。此方法给参数添加一个正态随机扰动,对不光滑的估计函数在这个扰动下求期望,得到一个新的光滑估计函数,然后基于这个新的光滑估计函数得到回归参数的估计。 经过迭代,诱导光滑方法可以同时得到参数的点估计及其协方差估计,进而得到回归参数的区间估计。由于此方法不需要额外确定调谐参数(如核估计的窗宽),此估计方法得到广泛应用[7-9]。 文中主要介绍直接法、自助法、诱导光滑法构造分位数回归模型区间估计的算法步骤,并通过模拟比较这3种方法构造的置信区间的覆盖率和平均置信区间长度。 1 分位数回归模型及其区间估计 假定得到观测数据为(xi,yi)(1≤i≤n),yi是响应变量,xi是p维协向量,分位数回归模型如下: 其中 1.1 直接法 这里hn是窗宽,当n→,hn→0,根据Hall和Sheather[12]方法选取 1.2 自助法 自助法是Efron[4]于1979年提出的一种再抽样统计方法,通过不断地从原始数据集中有放回抽取新样本,组成新的数据集。渐近理论保证了基于新的数据集计算的估计量与基于原始数据集的估计量有相同的渐近分布。此方法适用于那些难以用常规方法(如极大似然法、矩估计法等)导出参数的区间估计、假设检验等问题。 文中主要介绍如下两种自助法。 1.2.1 成对数据自助法 Arcones和Gine[13]提出成对自助法来构造M-估计的置信区间。成对数据自助法的步骤如下: 1)令 b=1; 4)重复步骤2)和3),直到产生B个β的估计。 1.2.2 加权自助法 Jin[14]等2001年提出一种通过扰动目标函数的重抽样方法。Tang和Leng[15]运用此方法构造纵向数据分位数回归参数的置信区间。此方法应用于分位数回归区间估计的步骤如下: 1)令b=1; 2)从参数为1的指数分布中产生随机数Vi~exp(1),i=1,2,…,n; 4)重复步骤2)和3),直到产生B个β的估计。 1.3 诱导光滑法 诱导光滑法最初是由Brown和Wang[5]于2005年提出,用于估计秩估计的渐近方差。Wang[6]等将之用于构造分位数回归区间估计。由于此光滑方法不像核估计等需要额外估计窗宽,使之得到许多统计学家的青睐。 诱导光滑算法步骤如下: 1)设定Γ的初始值:Γ(0)=n-1Ip; 2 模拟比较 通过模拟研究从置信区间长度和覆盖率两个角度来比较上述3类方法在构造分位数回归参数的置信区间上的表现。从如下分位数回归模型产生数据(xi,yi)(1≤i≤n): yi=β0+xiβ1+σ(xi)(εi-Qτ(εi)) i=1,2,…,n β的置信水平为95%的置信区间的平均长度和覆盖率(σ(xi)=1)见表1。 表1 β的置信水平为95%的置信区间的平均长度和覆盖率(σ(xi)=1) 从表1可以看出,直接法和诱导光滑法的置信区间平均长度比自助法估计的置信区间长度短。当样本量为20时,直接法和诱导光滑法的覆盖率较低,但是当样本量增至50和100时,他们的覆盖率都有所增加。 表2 β的置信水平为95%的置信区间的平均长度和覆盖率(σ(xi)=) 表2中,直接法的覆盖率较低。随着样本量增大,覆盖率也没有增加,说明直接法需要误差独立同分

您可能关注的文档

文档评论(0)

布丁文库 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体 重庆微铭汇信息技术有限公司
IP属地重庆
统一社会信用代码/组织机构代码
91500108305191485W

1亿VIP精品文档

相关文档