2.2 分层抽样与系统抽样
学习目标 1.理解并掌握系统抽样、分层抽样.2.会用系统抽样、分层抽样从总体中抽取样本.3.理解三种抽样的区别与联系.
知识点一 分层抽样
思考 分层抽样的总体具有什么特性?
答案 分层抽样的总体由差异明显的几部分构成,也就是说当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样. 梳理
1.分层抽样的概念
将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样. 2.分层抽样的适用条件
分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.
3.分层抽样的实施步骤
第一步,按某种特征将总体分成若干部分(层); 样本容量第二步,计算抽样比.抽样比=;
总体中的个体数第三步,各层抽取的个体数=各层总的个体数×抽样比; 第四步,依各层抽取的个体数,按简单随机抽样从各层抽取样本; 第五步,综合每层抽样,组成样本. 知识点二 系统抽样
思考1 当总体中的个体数较多时,为什么不宜用简单随机抽样?
答案 因为个体较多,采用简单随机抽样如制作号签等工作会耗费大量的人力、物力和时间,而且不容易做到“搅拌均匀”,从而使样本的代表性不强.
思考2 用系统抽样抽取样本时,每段各取一个号码,其中第1段的个体编号怎样抽取?以后各段的个体编号怎样抽取?
答案 用简单随机抽样抽取第1段的个体编号.在抽取第1段的号码之前,自定义规则确定以后各段的个体编号,通常是将第1段抽取的号码依次累加间隔k.
梳理
1.系统抽样的概念
将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样. 2.系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本,步骤为:
(1)先将总体的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;
NNN
(2)确定分段间隔k,对编号进行分段.当(n是样本容量)是整数时,取k=;当不是整数时,nnn先从总体中随机剔除几个个体,再重新编号, 然后分段; (3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);
(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号l+k,再加k得到第3个个体编号l+2k,依次进行下去,直到获取整个样本. 知识点三 三种抽样方法的比较
思考 系统抽样时,将总体分成均等的几部分,每部分抽取一个,符合分层抽样,故系统抽样就是一种特殊的分层抽样,这种说法对吗?
答案 不对,因为分层抽样是从各层地抽取个体,而系统抽样各段上抽取是按事先确定好的规则进行的,各层编号有联系,不是的,故系统抽样不同于分层抽样. 方法类别 简单随机抽样 抽样过程中每个个系统抽样 体被抽取的概率相分层抽样 等
类型一 分层抽样及应用
命题角度1 分层抽样适用情形判定
例1 某地区有高中生2 400人,初中生10 900人,小学生11 000人.当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?
解 (1)从总体来看,因为不同年龄阶段的学生的近视情况可能存在明显差异,为了使样本具
共同特点 抽样特征 从总体中逐个不放回抽取 将总体分成均衡的几相互联系 简单随机抽样是基础 用简单随机抽样抽取适用范围 样本容量较小 总体中的个体数较多,样本容量较大 总体由差异明显的几部分组成 部分,按规则关联抽取 起始号码 将总体分成几层,按比例分层抽取 用简单随机抽样或系统抽样对各层抽样 有较好的代表性,应该分高中、初中、小学三个层次分别抽样.
(2)从三类学生的数量来看,人数较多,所以在各层抽样时可以采用系统抽样. (3)采用系统抽样分好组之后,确定第一组人选时,可以采用简单随机抽样.
反思与感悟 分层抽样实质是利用已知信息尽量使样本结构与总体结构相似.在实际操作时,并不排斥与其他抽样方法联合使用.
跟踪训练1 某单位有员工500人,其中35岁以下的有125人,35岁~49岁的有280人,50岁以上的有95人.为了调查员工的身体状况,要从中抽取一个容量为100的样本,如何进行抽取?
解 因为员工按年龄分为三个层,各层的身体状况有明显的差异,所以为了使样本具有代表性,需要采用分层抽样.抽样比为1∶5,即每5人中抽取一人.
111
35岁以下:125×=25(人),35岁~49岁:280×=56(人),50岁以上:95×=19(人).
555命题角度2 分层抽样具体实施步骤
例2 某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层抽样的方法抽取,写出抽样过程. 解 抽样过程如下:
201
第一步,确定抽样比,样本容量与总体容量的比为=.
1608
1
第二步,确定分别从三类人员中抽取的人数,从行政人员中抽取16×=2(人);
81
从教师中抽取112×=14(人);
81
从后勤人员中抽取32×=4(人).
8
第三步,采用简单随机抽样的方法,抽取行政人员2人,教师14人,后勤人员4人. 第四步,把抽取的个体组合在一起构成所需样本.
反思与感悟 在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体容量之比.
跟踪训练2 某单位最近组织了一次健身活动,活动小组分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.1登山组的职工占参加活动总人数的,且该组中青年人占50%,中年人占40%,老年人占10%.
4为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样方法从参加活动的全体职工中抽取200人进行抽查,试确定:
(1)游泳组中,青年人、中年人、老年人分别所占的比例; (2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
解 (1)设登山组人数为x,则游泳组人数为3x,再设游泳组中,青年人、中年人、老年人各占比例分别为a、b、c,则有解得b=50%,c=10%, 故a=1-50%-10%=40%.
所以游泳组中,青年人、中年人、老年人各占的比例分别为40%、50%、10%.
33
(2)游泳组中,抽取的青年人人数为200××40%=60,抽取的中年人人数为200××50%=
443
75,抽取的老年人人数为200××10%=15.
4类型二 系统抽样及应用
例3 为了了解参加某种知识竞赛的1 000名学生的成绩,从中抽取一个容量为50的样本,那么采用什么抽样方法比较恰当?简述抽样过程. 解 适宜选用系统抽样,抽样过程如下:
(1)随机地将这1 000名学生编号为1,2,3,…,1000.
(2)将总体按编号顺序均分成50个部分,每部分包括20个个体.
(3)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码l.
(4)以l为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:l,l+20,l+40,…,l+980. 引申探究
在本例中,如果总体是1 002,其余条件不变,又该怎么抽样? 解 (1)将每个学生编一个号,由1至1002. (2)利用随机数法剔除2个号.
(3)将剩余的1 000名学生重新编号1至1000.
(4)按编号顺序均分成50个部分,每部分包括20个个体.
(5)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码l.
(6)以l为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:l,l+20,l+40,…,l+980.
反思与感悟 当总体中的个体数不能被样本容量整除时,需要在总体中剔除一些个体.由于剔除方法采用简单随机抽样,所以即使是被剔除的个体,在整个抽样过程中被抽到的机会和其他个体是一样的.
跟踪训练3 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个工人编一个号,由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新编号0001至1000.
x·40%+3xbx·10%+3xc
=47.5%,=10%, 4x4x1 000
(4)分段,取间隔k==100,将总体均分为10组,每组100个工人.
10(5)从第一段即0001号到0100号中随机抽取一个号l. (6)按编号将l,100+l,200+l,…,900+l,共10个号选出. 这10个号所对应的工人组成样本.
1.检测员每10分钟从匀速传递的新产品生产流水线上抽取一件新产品进行某项指标检测,这样的抽样方法是( ) A.系统抽样法 C.随机数法 答案 A
解析 根据系统抽样的定义和性质进行判断即可.
2.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为( )
A.101 B.808 C.1 212 D.2 012 答案 B
12解析 根据分层抽样,得N×=96,解得N=808,故选B.
12+21+25+43
3.为了调查某省各城市PM2.5的值,按地域把36个城市分成甲、乙、丙三组,对应的城市数分别为6,12,18.若用分层抽样的方法抽取12个城市,则乙组中应抽取的城市数为________. 答案 4
解析 乙组城市数占总城市数的比例为1
市数为12×=4.
3
4.某班级有50名学生,现要采用系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号为1~50号,并均匀分组,第一组1~5号,第二组6~10号,…,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为________的学生. 答案 37
解析 因为12=5×2+2,所以第n组中抽得号码为5(n-1)+2的学生.所以第八组中抽得号码为5×7+2=37的学生.
5.一批产品中有一级品100个,二级品60个,三级品40个,分别用系统抽样法和分层抽样法从这批产品中抽取一个容量为20的样本.
121
=,样本容量为12,故乙组中应抽取的城
6+12+183B.抽签法 D.其他抽样方法
解 系统抽样法:将200个产品编号为1~200,然后将编号分成20个部分,在第1部分中用简单随机抽样法抽取1个编号.如抽到5号,那么得到编号为5,15,25,…,195的个体,即可得到所需样本.
201
分层抽样法:因为100+60+40=200,所以=,
20010111
所以100×=10,60×=6,40×=4.
101010
因此在一级品、二级品和三级品中分别抽取10个、6个和4个,即可得到所需样本.
1.系统抽样有以下特点: (1)适用于总体容量较大的情况;
(2)剔除多余个体及第一段抽样都要用简单随机抽样,因而与简单随机抽样有密切联系; n
(3)是等可能抽样,每个个体被抽到的可能性都是;
N(4)是不放回抽样.
在抽样时,只要第一段抽取的个体确定了,后面各段中要抽取的个体依照事先确定好的规律就自动地被抽出,因此简单易行.
2.总体容量小,简单随机抽样;总体容量大,系统抽样;总体差异明显,分层抽样.在实际抽样中,为了使样本具有代表性,通常要同时使用几种抽样方法.
40分钟课时作业
一、选择题
1.为了抽查某城市小轿车年检情况,在该城市采取抽车牌末位数字为6的小轿车进行检查,这种抽样方法是( ) A.随机数法 C.系统抽样法 答案 C
解析 由于每个车牌的末位数字为0,1,2,…,9十个数字之一,某辆车车牌末位数字为6是随机的,这相当于将所有汽车分成若干组,每组10个(车牌的末位数字依次为0,1,2,…,9),取每一组中的第6个,故为系统抽样.
2.某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样方法抽取4个班进行调查,若抽到的编号之和为48,则抽到的最小编号为( ) A.2 C.4
B.3 D.5 B.抽签法 D.其他抽样方法
答案 B
24
解析 由题意得系统抽样的抽样间隔为=6.设抽到的最小编号为x,则x+(6+x)+(12+x)
4+(18+x)=48,所以x=3,故选B.
3.从N个编号中抽取n个号码作样本,考虑用系统抽样方法,抽样距为( ) NA. nNC.n 答案 C
N
解析 系统抽样的间隔为的整数部分.
n
4.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( ) A.p1=p2<p3 C.p1=p3<p2 答案 D
解析 因为采取简单随机抽样、系统抽样和分层抽样抽取样本时,总体中每个个体被抽中的概率相等,故选D.
5.某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,1高二学生数比高一学生数多300人,现在按的抽样比用分层抽样的方法抽取样本,则应抽
100取高一学生数为( ) A.8 C.16 答案 A
xxxx
解析 若设高三学生数为x,则高一学生数为,高二学生数为+300,所以有x+++300
2222800
=3 500,解得x=1 600.故高一学生数为800,因此应抽取高一学生数为=8.
1006.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A.11 B.12 C.13 D.14 答案 B
720-480840
解析 由于=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为
4220=240
=12. 20
B.11 D.10 B.p2=p3<p1 D.p1=p2=p3 B.n ND.n+1
二、填空题
7.某企业共有职工150人,其中高级职称15人,中级职称45人,低级职称90人,现采用分层抽样来抽取30人,则抽取的高级职称的人数为________. 答案 3
3011
解析 由题意得抽样比为=,所以抽取的高级职称的人数为15×=3.
15055
8.某工厂生产A、B、C三种不同型号的产品,产品数量之比为2∶3∶5.现用分层抽样的方法抽出一个容量为n的样本,其中A种型号产品有16件,那么此样本的容量n=________. 答案 80
2
解析 16÷=80.
2+3+5
9.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1~200编号,分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为________.若采用分层抽样,40岁以下年龄段应抽取________人.
答案 37 20
解析 将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%40x
=100,设在40岁以下年龄段中应抽取x人,则=,解得x=20.
200100
10.某班共有学生52人,现根据学生的学号用系统抽样的方法抽取一个容量为4的样本,已知学号为6号、32号、45号的同学在样本中,那么样本中剩下的一个同学的学号是________号. 答案 19
解析 ∵45-32=13,∴抽样间隔为13,故抽取学生的学号依次为6、19、32、45,故填19. 三、解答题
11.一个公司有职工160人,其中业务人员120人,管理人员16人,后勤服务人员24人.为了了解职工的某种情况,要从中抽取一个容量为20的样本,用分层抽样的方法抽取样本,并写出过程.
解 样本容量与职工总人数的比为20∶160=1∶8,所以业务人员、管理人员和后勤服务人1201624
员各应抽取的人数分别为、和,即分别为15、2和3,每一层抽取时采用简单随机抽
888样或系统抽样,再将各层抽取的个体合在一起,就得到要抽取的样本.
12.某停车场停有6辆卡车、12辆小轿车和18辆电动车,现要从这些车辆中抽取一个容量为
n的样本进行某项指标调查.若采用系统抽样的方法或分层抽样的方法抽取,则不用剔除个体;若样本容量增加1,则在采用系统抽样的方法时,需要在总体中先剔除1个个体,求样本容量n.
36解 由题意知总体容量为6+12+18=36.当样本容量是n时,由题意知,系统抽样的间隔为,nnnnnn
分层抽样的抽样比是,分层抽样过程中,抽取的卡车数为·6=,轿车数为·12=,电
36366363nn
动车数为·18=,所以n应是6的倍数,36的约数,且0<n<36,即n=6,12,18.
362当样本容量为n+1时,剔除一个个体后的总体容量是35, 3535
系统抽样的间隔为,所以必须是整数,
n+1n+1所以n只能取6,即样本容量n=6.
13.为了对某课题进行研究,分别从A、B、C三所高校中用分层抽样法抽取若干名教授组成研究小组,其中高校A有m名教授,高校B有72名教授,高校C有n名教授(其中0<m≤72≤n). (1)若A、B两所高校抽取3名教授,B、C两所高校抽取5名教授,求m、n; 2
(2)若高校B中抽取的教授数是高校A和C中抽取的教授数的,求三所高校的教授的总人数.
3解 (1)∵0<m≤72≤n,A、B两所高校抽取3名教授,∴B高校中抽取2人,∴A高校123
中抽取1人,C高校中抽取3人,∴==,解得m=36,n=108.
m72n
22
(2)∵高校B中抽取的教授数是高校A和C中抽取的教授数的,∴(m+n)=72,解得m+n
33=108,
∴三所高校的教授的总人数为m+n+72=180.