什么是分层抽样

什么是分层抽样,第1张

分层抽样也称为分类抽样或类型抽样,是将抽样总体按某一标识分层,然后从每层中抽取样本单位构成样本进行数据采集和参数估计的方法和过程。

分层抽样是社会调查实务中经常用的抽样技术,它具有以下特点。

(1)分层抽样按层进行调查,便于 *** 作、方便管理。

(2)分层抽样中各层的抽样相对独立,可以分别估计出各层总体参数数值。

(3)当抽样总体各层之中各单位标识变异程度较小,且各层之间的标识变异程度较大时,分层抽样可以显著提高抽样效率。

分层抽样法也叫类型抽样法。它是从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样品(个体)的方法。这种方法的优点是,样本的代表性比较好,抽样误差比较小。缺点是抽样手续较简单随机抽样还要繁杂些。定量调查中的分层抽样是一种卓越的概率抽样方式,在调查中经常被使用。

分层抽样是把总体各单位分成两个或两个以上的相互独立的完全的组,从两个或两个以上的组中进行简单随机抽样,样本相互独立。总体各单位按主要标志加以分组,分组的标志与关心的总体特征相关。例如,正在进行有关啤酒品牌知名度方面的调查,初步判别,在啤酒方面男性的知识与和女性的不同,那么性别应是划分层次的适当标准。如果不以这种方式进行分层抽样,分层抽样就得不到什么效果,花再多时间、精力和物资也是白费。

扩展资料:

分层抽样的应用

总体中赖以进行分层的变量为分层变量,理想的分层变量是调查中要加以测量的变量或与其高度相关的变量。分层的原则是增加层内的同质性和层间的异质性。常见的分层变量有性别、年龄、教育、职业等。分层随机抽样在实际抽样调查中广泛使用,在同样样本容量的情况下,它比纯随机抽样的精度高,此外管理方便,费用少,效度高。

参考资料来源:百度百科-抽样

参考资料来源:百度百科-分层抽样

(stratificationsampling)

(薛有祝)

按一定的属性将总体划分为若干层(副总体),按层抽样统计以估计总体的方法。又称类型抽样或分类抽样。当各层为简单随机样本时,称分层随机抽样,简称分层抽样;当各层为系统样本时,称分层系统抽样(见图)。通过分层可提高总体抽样精度;可得到各层资源数据和主要层估计精度;按林分分层可编制林相图、森林分布图等图面资料。但是,只有分层后各层的平均数存在显著差异时,分层才比不分层(简单随机)抽样好;层平均数差异越大,分层效率越高。同时,它要求:①各层的总体单元数或权重必须确知;②总体划分为数层后,各层间任何单元都没有重叠或遗漏;③在各层中进行的抽样是独立的。分层抽样有按地域分层、林分分层、样地分层等形式,这里侧重介绍按林分分层的方法。

应用情况

中国从1964年开始引用。主要应用于:①具有合适航空象片等图面资料、林相有利于分层、有一定专业技术力量的林业局、县、林场的二类调查。②森林资源汇总。把若干小总体合并成一个大总体,要根据由各个小总体中所抽取的随机样本或系统样本资料估计大总体时,可将每个小总体作为一个层,用分层抽样的估计方法对大总体进行估计。如根据县的森林资源抽样资料求全省的、根据省的森林资源抽样资料求全国的,都属于这种情况,类同按地域分层。此外,分层抽样也可用于小班调查。

分层抽样示意图

落叶松天然林分的分层级距和层代号表

郁闭度 层代号 龄组 疏 ≤0.3 中 0.4~0.6 密≥0.7 幼(≤40年) 落幼疏 落幼中 落幼密 中(41~100年) 落中疏 落中中 落中密 成(≥101年) 落成疏 落成中 落成密工作步骤

①分层方案的确定:主要根据生产需要、森林结构、航空象片判读性能等确定。要求:有利于缩小层内方差,扩大层间方差;层的划分尽量与经营单位一致;样本大小既定情况下,分层不宜过多、层面积不宜过小;正确确定分层因子及其级距。中国以清查森林蓄积量为目的的资源清查,一般按地类、优势树种、龄组、郁闭度作为分层因子。如落叶松天然林分的分层常采用表中标准。②准确求算各层面积及权重:通过分层判读、航空象片的森林调绘、编制分层平面图等,计算各层面积和权重。③样本单元数的确定与分配:有按面积比例分配、最优分配、任意分配等配置方式。生产中常用比例分层抽样。在重复抽样条件下,样本单元数的计算公式为

式中 t为可靠性指标;E为相对误差限;Wh为h层权重;δ2h为h层的总体方差;为总体平均数,根据已往资料或预备调查资料确定。在非重复抽样条件下,样本单元数为

式中 N为总体单元数;n/N为抽样比。④布点及样地调查(见系统抽样)。⑤内业计算:包括各层特征数计算(见随机抽样)和总体平均数估计值、总体平均数估计值方差、误差限、精度、总体蓄积量估计值等的计算。

总体平均数估计值:

总体平均数估计值的方差:

绝对误差限:

相对误差限:

估计精度:P=1-E总体蓄积量估计值:

总体蓄积量估计区间:

式中 L为总体内的层数;Yh为第h层的样本平均数;为第h层的标准误;t为可靠性指标,按自由度n-L查小样本t分布表;A为总体面积;a为样地面积。分层抽样的估计误差限,需按重复抽样、非重复抽样、各层样本单元数充分大和比较小等情况,分别进行正确估计。

评价

分层抽样是一种有较高效率的抽样方法,但下列情况下均不宜采用:当总体内各类型林分平均蓄积量相差不大、方差相似;不具备合适的航空象片等图面资料;林相破碎、零星插花严重,很难确切分层和总体各层权重不确知。同时,在应用中要注意:①在航空象片上必须分层正确、判读准确。②样地不跨层,正确处理样地错层问题。③样地落在有林地某层小空地内时,应做为该层的一个数值为零的样地。④在没有合适航空象片,用图进行分层抽样调查时(即布点前不知道层面积),采用一次外业,同时完成样地调查和层化小班,待内业再分层计算。但其抽样误差与上面介绍的先分层后抽样的抽样误差不同,它包括比例分层抽样误差和因总体中只有一次抽样且各层抽样又不独立所产生的误差。当各层方差相差不大或样本单元数很大时,后一项误差很小,可以略去。

参考书目

W.G.科克伦著,张尧庭、吴辉译:《抽样技术》,中国统计出版社,1985。(W.G.Cochran,Sampling Techniques,3rd Ed.,John Wiley and Sons,New York,1977.)

B.胡希、C.I.米勒、T.W.比尔斯合著,测树学翻译组译:《测树学》,中国林业出版社,1981。(B.Husch,C.I.Miller,T.W.Beers,Forest Mensuration,The Ronald Press Company,2nd Ed.,New York,1972.)


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5886716.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-04
下一篇 2023-03-04

发表评论

登录后才能评论

评论列表(0条)

保存