什么是分层抽样

分层抽样法,也称作类型抽样法 。指的是将总体单位按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本单位 。这种方法的优点是,样本的代表性比较好,抽样误差比较小 。缺点是抽样手续较简单随机抽样还要繁杂些 。定量调查中的分层抽样是一种卓越的概率抽样方式,在调查中经常被使用 。
分层抽样的特点是:由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本 。
分层抽样的具体程序是:把总体各单位分成两个或两个以上的相互独立的完全的组,从两个或两个以上的组中进行简单随机抽样,样本相互独立 。总体各单位按主要标志加以分组,分组的标志与关心的总体特征相关 。
例如,正在进行有关啤酒品牌知名度方面的调查,初步判别,在啤酒方面男性的知识与和女性不相同,那么性别应是划分层次的适当标志 。如果不以这种方式进行分层抽样,分层抽样就得不到什么效果,花再多时间、精力和物资也是白费 。
分层抽样法的概念是什么?分层抽样又称类型抽样,是一种较为常用的抽样方法 。在样本大小不变的情况下,总体的一致性越高,抽样误差就越小 。分层抽样是先将总体中的所有单位按某种特征或属性(如性别、年龄、职业或地域等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取一个子样本,最后将这些子样本合起来构成总体的样本 。
分层抽样的基本步骤是:总体分层—层中抽样—子样本集合 。例如,在一所大学抽取学生进行调查时,可以先把总体分为男生和女生两大类;然后采用简单随机抽样或系统抽样的方法,分别从男生和女生中各抽取100名学生 。这样,由这200名学生所构成的就是一个由分层抽样所得到的样本 。
分层抽样是什么?(stratificationsampling)
(薛有祝)
按一定的属性将总体划分为若干层(副总体),按层抽样统计以估计总体的方法 。又称类型抽样或分类抽样 。当各层为简单随机样本时,称分层随机抽样,简称分层抽样;当各层为系统样本时,称分层系统抽样(见图) 。通过分层可提高总体抽样精度;可得到各层资源数据和主要层估计精度;按林分分层可编制林相图、森林分布图等图面资料 。但是,只有分层后各层的平均数存在显著差异时,分层才比不分层(简单随机)抽样好;层平均数差异越大,分层效率越高 。同时,它要求:①各层的总体单元数或权重必须确知;②总体划分为数层后,各层间任何单元都没有重叠或遗漏;③在各层中进行的抽样是独立的 。分层抽样有按地域分层、林分分层、样地分层等形式,这里侧重介绍按林分分层的方法 。
应用情况
中国从1964年开始引用 。主要应用于:①具有合适航空象片等图面资料、林相有利于分层、有一定专业技术力量的林业局、县、林场的二类调查 。②森林资源汇总 。把若干小总体合并成一个大总体,要根据由各个小总体中所抽取的随机样本或系统样本资料估计大总体时,可将每个小总体作为一个层,用分层抽样的估计方法对大总体进行估计 。如根据县的森林资源抽样资料求全省的、根据省的森林资源抽样资料求全国的,都属于这种情况,类同按地域分层 。此外,分层抽样也可用于小班调查 。
分层抽样示意图
落叶松天然林分的分层级距和层代号表
郁闭度 层代号 龄组 疏 ≤0.3 中 0.4~0.6 密≥0.7 幼(≤40年) 落幼疏 落幼中 落幼密 中(41~100年) 落中疏 落中中 落中密 成(≥101年) 落成疏 落成中 落成密工作步骤
①分层方案的确定:主要根据生产需要、森林结构、航空象片判读性能等确定 。要求:有利于缩小层内方差,扩大层间方差;层的划分尽量与经营单位一致;样本大小既定情况下,分层不宜过多、层面积不宜过小;正确确定分层因子及其级距 。中国以清查森林蓄积量为目的的资源清查,一般按地类、优势树种、龄组、郁闭度作为分层因子 。如落叶松天然林分的分层常采用表中标准 。②准确求算各层面积及权重:通过分层判读、航空象片的森林调绘、编制分层平面图等,计算各层面积和权重 。③样本单元数的确定与分配:有按面积比例分配、最优分配、任意分配等配置方式 。生产中常用比例分层抽样 。在重复抽样条件下,样本单元数的计算公式为
式中 t为可靠性指标;E为相对误差限;Wh为h层权重;δ2h为h层的总体方差;为总体平均数,根据已往资料或预备调查资料确定 。在非重复抽样条件下,样本单元数为