- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
?
?
基于分位数回归的中国城乡居民收入影响因素研究
?
?
汪子琦汪正飞钱星曌
[摘要]本文利用CFPS2018的person数据,对城镇人口和乡村人口分别进行多元线性回归和分位数回归,接着再用组合检验方法基于这两个地方所对的多元线性回归系数差异进行检验,然后再对城乡不同分位数下的分位数回归系数进行检验。结果表明,(1)多元线性回归中,被调查对象的受教育年限对收入的影响在0.1的显著性水平下存在城乡差异。(2)在75%分位点上,使用计算机的城镇居民在受教育年限对工作年收入的影响在10%显著性水平受到教育年限更强的影响。总之,分位数回归能根据每个调查对象的不同收入情况进行分析,从而可以为各收入人群提出更明确的建议。
[关键词]分位数回归;CFPS2018数据;收入影响因素;组合检验
0引言
十九大报告中,习近平同志提出我国现阶段主要矛盾是人民对美好生活的向往和发展不平衡不充分之间的矛盾,为了实现全面脱贫,需要缩小城乡居民收入的差距,实现共同富裕。从这个意义上,对城乡居民收入差距的研究不容忽视。
不少学者发现了影响收入的因素有很多,李雅楠和廖利兵(2011)使用基于RIF分位数回归方法利用1991~2009年的中国营养和健康调查数据,发现低收入分位点上的性别收入差距有所扩大,而高收入分位点相反[1]。陈梦雨(2016)较为全面地用线性回归和分位数回归论证了性别、年龄、受教育程度、城乡户籍和地区等因素对收入的影响[2]。刘国辉和张卫国(2016)基于分位数回归方法利用中国综合社会调查(CGSS2006)数据发现外语的使用回报率对不同阶层收入的影响有显著差异[3]。刘晓倩和韩青(2018)利用CFPS2014数据使用内生转换模型估计互联网使用对农村居民收入的影响,发现使用互联网的居民年收入有所提高[4]。也有不少学者发现教育也对收入存在影响,Sannicandro等(2018)使用多层建模技术对2008-2013年美国康复服务管理局的档案进行分析,发现高等教育可在一定程度上解决低就业率的智障人士问题提高收入[5]。叶杰和徐越倩(2019)构建了以规则意识和努力主导型价值观为中介变量和调节变量的有调节的中介作用模型,对CGSS数据加以验证,发现努力主导型价值观正向调节了教育水平对个人收入的正向影響[6]。
城乡收入分配不均也受到越来越多的人的关注,不少学者已经开始重视这方面的研究。张洋洋(2017)基于分位数回归的M-M分解对于CHNS数据探究了城乡各个收入段家庭收入影响因素,发现城乡高收入家庭的收入差距比中低收入家庭更大[7]。华昱(2018)利用明瑟方程讨论了互联网使用对收入增长的效应,通过对照试验发现城市居民可从互联网中获得更高的收入回报率[8]。贺娅萍和徐康宁(2019)运用中国省级单元在2004~2015年间的数据进行检验,发现互联网的使用拉大了城乡差距,这种效应随着地区经济发展水平的变化而变化[9]。梁莹和崔惠民(2019)对全国7个省(直辖市)的数据进行研究发现居民受教育程度对城乡居民收入影响有所差异[10]。基于以上研究,本文将分别使用均值回归和分位数回归对居民收入影响程度的城乡差异进行研究,并采用组合检验方法来检验哪些变量分别在均值回归,0.25、0.5和0.75分位点上的分位数回归,并对每个城乡每个收入层次进行分析。
1.研究方法
1.1分位数回归
分位数回归是Koenker和Basset(1978)提出的在给定自变量条件下,因变量在不同分位点上的变动趋势[11]。该模型参数向量可由最小绝对加权误差可得,求解结果有如下形式:
其中,X{是各自变量组成的行向量,
1.2组合检验
组合检验是检验两组样本间的分布差异,已知两组样本的个数,分别记为n1和n2,先计算两细样本真实均值之差,在重复若干次实验,每次随机抽取n1个样本,再分别计算抽出样本和剩余样本的均值之差,并与真实均值之差进行比较。这里我们选取双侧检验,令m为重复实验中两组样本均值之差的绝对值大于真实两组样本均值之差的个数,其与抽样次数的比值即为P值,当P值小于0.1时,可以拒绝两组样本无显著差异的原假设。
2.实证分析
该部分中,我们选取被调查对象的性别、年龄、是否使用外语、是否使用计算机、上网时工作的重要性、智力水平、以及最高教育年限为解释变量,以年工作总收入为被解释变量,使用Stata15.1进行实证分析。
2.1数据来源和描述
本文数据选自中国家庭跟踪调查(CFPS)2018中的person数据库,删除含有缺失值、异常值和不适用的样本,有效样本共3683个,各定量变量和定性变量的描述性统计情况如表1和表2所示:
通过以上两表可知,上网时的工作重要程度和智力水平的平均水平比较高,且大多数调调查对象来自城镇、男性占多数、更多的人在使用计算机,但较
文档评论(0)