对于分层随机抽样.ppt

  1. 1、本文档共109页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对于分层随机抽样.ppt

第四章 分层抽样 本章要点 本章主要是对分层抽样理论包括抽样方式、估计量及其性质、样本量的确定及分配、分层抽样设计效果等进行系统全面地介绍。具体要求: ①正确理解层、分层抽样以及分层随机抽样的涵义,分层抽样的特点及作用; ②掌握分层抽样的参数估计量及其性质; ③掌握分层抽样样本量的确定方法; ④了解分层抽样的设计效果; ⑤了解分层抽样其他有关理论问题,包括层权偏差、最优分配偏差、事后分层等。 第一节 抽样方式 第二节 简单估计量及其性质 第三节 样本量的分配 第四节 样本量的确定 第五节 分层抽样设计效果分析 第六节 进一步讨论的问题 注: 总体中的每个单位,一定并且只属于某一层,不能同时属于两层或不属于任何一层 分层抽样得以实施的前提条件准备好关于层的抽样框 分层是按照单位的某个特征或指标进行的 二、分层抽样的特点 (一)分层抽样可以提高参数估计的精度。 (二)分层抽样不仅能对总体参数进行估计,而且能对各层(子总体)参数进行估计。 (三)便于依托行政管理机构进行组织和实施,同时还可以根据各层的不同特点采用不同的抽样方式。 (四)分层抽样样本在总体中分布更加均匀。 三、层的划分原则 (一)层内单元具有相同性质,通常按调查对象的不同类型进行划分。能够对每一类的目标量进行估计。 (二)尽可能使层内单元的标志值相近,层间单元的差异尽可能大,从而达到提高抽样估计精度的目的。 (三)既按类型又按层内单元标志值相近的原则进行多重分层,同时达到实现估计类值以及提高估计精度的目的。 (四)为了抽样组织实施的方便,通常按行政管理机构设置进行分层。 第二节 简单估计量及其性质 一、总体均值的估计 (一)简单估计的定义 (二)估计量的性质 二、总体总值的估计 (一)简单估计的定义 (二)估计量的性质 三、总体比例的估计 (一)简单估计的定义 (二)估计量的性质 一、比例分配 比例分配指的是按各层单元数占总体单元数的比例进行分配,也就是按各层的层权进行分配,即 二、最优分配 (一)最优分配 最优分配是指在分层随机抽样中,如何将样本量分配到各层,使得在总费用给定的条件下,估计量的方差达到最小;或在给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。 如果我们考虑简单线性费用函数,总费用 但当分层变量Xi为连续性定量变量时,层的划分则比较困难。常用的一种分层方法是确定层界的快速近似法,它是由戴伦纽斯(Dalenius)与霍捷斯(Hodges)提出的。 其做法是将分层变量(例如xi)分布的累积平方根进行等分来获得最优分层,因此这种方法也称为累积平方根法。 但当遇到运用累积平方根法进行分层时,就存在确定层数的问题。 因此,当层数增加到一定的时候,在精度上的收益将非常小。根据研究,除非Y与X的相关系数 ,层数一般不超过6为宜。 (二)查特吉(Chatterjee)法 考虑实际分配的样本量 对每个目标偏离其最优分配 引起的方差相对增加RVj: 当方差V给定时,得到样本量为: 而当总费用C是给定时,有: 对其求和得到样本量为: 三、总体参数为P的情形 当方差V给定时,如果 都比较大,使得 则按比例分配时总样本量为: 按Neyman分配时 计算样本量之前,需要对Ph作预估计。 【例4.5】(续例4.2) 如果要求在95%置信度下,绝对误差不超过5%,则按比例分配和Neyman分配时,总样本量分别为多少? 解:在置信度95%时,对应的t=1.96,而绝对误差d=5%,因此 按比例分配时:可以得到 调整后的样本量为: 按Neyman分配时: 第五节 分层抽样设计效果分析 我们将从理论上将分层随机抽样与简单随机抽样进行效果比较,即在相同样本量下,比较其估计量的方差大小。为比较分层随机抽样与简单随机抽样的精度,我们拟在样本量为比例分配的形式下讨论。 一、分层随机抽样与简单随机抽样的比较 记简单随机抽样(对均值估计量)的方差为: 比例分配的分层随机抽样相应估计量的方差为: 根据总体单元指标的平方和分解可得: 如果各层Nh都比较大,则: 因而: 两边乘(1-f)/n 上式右边第二项是层间平方和,为非负,因此有: 方差差值为: 这表明层平均数的差异愈大,分层的效果就愈好,若层平均数都相等,则分层与不分层效果相同。 主要针对比例分配与内曼分配抽样效果进行比较分析。 其中: 二、分层随机抽样各种样本量分配方法之间的比较 实际工作中,除非各层的标准差相差很大

文档评论(0)

wendang_12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档