1、随机抽样编稿:丁会敏 审稿:【学习目标】1、了解简单随机抽样的概念,掌握实施简单随机抽样的常用方法:抽签法和随机数表法;2、了解系统抽样的意义,并会用系统抽样的方法从总体中抽取样本;3、了解分层抽样的概念与特征,清楚简单随机抽样、系统抽样、分层抽样的区别和联系.【要点梳理】要点一、简单随机抽样简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:放回和不放回.我们在抽样调查中用的是不放回抽取.1、简单随机抽样的概念:一般地,从元素个数为N的总体中不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫
2、做简单随机样本.2、简单随机抽样的特点:(1)被抽取样本的总体个数N是有限的;(2)简单随机样本数n小于等于样本总体的个数N;(3)从总体中逐个进行抽取,使抽样便于在实践中操作;(4)它是不放回抽取,这使其具有广泛应用性;(5)每一次抽样时,每个个体等可能的被抽到,保证了抽样方法的公平性.3、实施抽样的方法:(1)抽签法:抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力又不方便,若标号的纸片或小球搅拌得不均匀还可能导致抽样的不公平.抽签法的一般步骤:将总体中的N个个体编号;把这N个号码写在形状、大小相同的号签上;将号签放在同一箱中,并搅拌均匀;从箱中每次抽取一个号签,连续抽取n次
3、;将总体中与抽到的号签的编号一致的n个个体取出.(2)随机数表法:要理解好随机数表,即表中每个位置上等可能出现0,1,2,9这十个数字的数表.随机数表中各个位置上出现各个数字的等可能性,决定了利用随机数表进行抽样时抽取到总体中各个个体序号的等可能性.随机数表法的步骤:将总体的个体编号(每个号码的位数一致);在随机数表中任选一个数字作为开始;从选定的数开始按一定的方向读下去,若得到的数码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止.注意:选定开始数字,要保证所选数字的随机性;确定读数方向获取样本号码时,读数方向可向左、向右、向上、向下,样本号码不能重
4、复,否则舍去.要点诠释: 1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法.2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型.3、简单随机抽样每个个体入样的可能性都相等,均为,但是这里一定要将每个个体入样的可能性、第n次每个个体入样的可能性、特定的个体在第n次被抽到的可能性
5、这三种情况区分开来,避免在解题中出现错误.要点二、系统抽样1、系统抽样的概念:当总体中的个体比较多时,将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样,也称作等距抽样.2、系统抽样的特征:(1)当总体容量N较大时,采用系统抽样;(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样;(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.3、系统抽样的一般步骤:(1)采用随机的方法将总体中的N个个体编号;(2)将编号按
6、间隔分段,当是整数时,取,当不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数能被整除,这时取,并将剩下的总体重新编号;(3)在第一段用简单随机抽样确定起始个体的编号;(4)按照一定的规则抽取样本,通常是将编号为的个体取出.要点诠释:1、从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想.2、系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段中进行抽样时,采用的是简单随机抽样.要点三、分层抽样1、分层抽样的概念:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按
7、某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.2、分层抽样的特点:(1)适用于总体是由有明显差别的几部分组成时的情况;(2)分层抽样对各个个体来说被抽取的可能性相同.3、分层抽样的优点:(1)样本具有较强的代表性;(2)在各层抽样时,可灵活地选用不同的抽样方法.4、分层抽样的步骤:(1)将总体按一定的标准分层;(2)计算各层的个体数与总体的个体数的比;(3)按各层个体数占总体的个体数的比确定各层应抽取的样本容量;(4)在每一层进行抽样(各层可以按简单随机抽样或系统抽样的方法抽取)要点诠释:1、应用分层抽样应
8、遵循以下要求:(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等.2、分层抽样是当总体有差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是,层内样本的差异要小,而层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样.(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.3、
9、分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法.要点四、三种抽样方法的比较类别简单随机抽样系统抽样分层抽样共同点(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样各自特点从总体中逐个抽取将总体均分成几部分按事先确定的规则在各部分抽取将总体分成层,分层进行抽取相互联系在起始部分抽样时采用简单随机抽样各层抽样采用简单随机抽样或系统抽样适用范围总体中个体数较少总体中个体数较多总体由差异明显的几部分组成 【典型例题】类型一:简单随机抽样例1.下面的抽样方法是简单随机抽样吗?为
10、什么? (1)从无数个个体中抽取50个个体作为样本; (2)仓库中有l万支奥运火炬,从中一次性抽取100支火炬进行质量检查; (3)某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴四川参加抗震救灾工作;(4)一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签【解析】(1)不是简单随机抽样因为简单随机抽样要求被抽取的样本总体的个数是有限的 (2)不是简单随机抽样虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取” (3)不是简单随机抽样因为这50名官兵是从中挑选出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽
11、样中“等可能抽样”的要求 (4)是简单随机抽样因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等可能的抽样【总结升华】 要判断所给的抽样方法是否是简单随机抽样关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点:(1)总体的个数有限;(2)逐个抽取;(3)是不放回的抽取;(4)每个个体被抽到的可能性必须是相同的举一反三: 【变式1】下面的抽样方法是简单随机抽样吗?为什么? (1)某班45名同学,指定个子最高的5名同学参加学校组织的某项活动 (2)从20个零件中一次性抽出3个进行质量检验 (3)一小孩从玩具箱中的20件玩具中随意拿出一件来玩玩后放回再拿下一件,连续
12、玩了5件【解析】(1)不是简单随机抽样因为这不是等可能抽样 (2)不是简单随机抽样因为这是“一次性”抽取,而不是“逐个”抽取 (3)不是简单随机抽样因为这是有放回抽样例2某大学为了支援西部教育事业,现从报名的18名志愿者中选取6人组成志愿小组请用抽签法设计抽样方案 【解析】 方案如下: 第一步:将18名志愿者编号,号码是01,02,18; 第二步:将号码分别写在形状、大小相同的纸条上,揉成团,制成号签; 第三步:将得到的号签放入一个不透明的袋子中,并充分搅匀; 第四步:从袋子中依次抽取6个号签,并记录上面的编号: 第五步:所得号码对应的志愿者就是志愿小组的成员【总结升华】 一个抽样试验能否用抽
13、签法,关键看两点:一是制签是否方便;二是号签是否容易被搅匀一般地,当样本容量和总体容量较小时可用抽签法举一反三: 【变式1】一个学生在一次竞赛中要回答的8道题是这样产生的:从15道物理题中随机抽3道;从20道化学题中随机抽3道;从12道生物题中随机抽2道使用合适的方法确定这个学生所要回答的三门学科问题的序号(物理题的编号为0115,化学题的编号为1635,生物题的编号为3647)【解析】第一步:将试题的编号0147分别写在形状、大小相同的纸条上,将纸条揉成团制成号签,并将物理、化学、生物题的号签分别放在三个不透明的袋子中,充分搅匀第二步:从装有物理题的袋子中逐个抽取3个号签,从装有化学题的袋子
14、中逐个抽取3个号签,从装有生物题的袋子中逐个抽取2个号签,并记录所得号签上的编号这便是所要回答的三门学科问题的序号 例3现有120台机器,请用随机数表法抽取10台机器,写出抽样过程 【思路点拨】已知N=120,n=10,用随机数表法抽样时编号000,001,119,抽取10个编号(都是三位数),对应的机器组成样本【解析】 使用随机数表法步骤如下: 第一步,先将120台机器编号,可以编为000,001,002,119; 第二步,在随机数表中任选一个数作为开始,任选一个方向作为读数方向,例如选出第9行第7列的数3,向右读; 第三步,从选定的数3开始向右读,每次读取三位,凡不在000119中的数跳过
15、去不读,前面已经读过的也跳过去不读依次可得到074,100,094,052,080,003,105,107,083,092; 第四步,以上这10个号码074,100,094,052,080,003,105,107,083,092所对应的10台机器就是要抽取的对象【总结升华】 用随机数表法抽取样本,编号时要注意使号码的位数相同如本题将个体编号的位数统一为3位,即在位数较少的数前添加“0”,方便读表举一反三: 【变式1】某校有学生1200人,为了调查某种情况,打算抽取一个样本容量为50的样本,问此样本若采用简单随机抽样将如何进行?【解析】首先将该校学生都编上号码:0001,0002,0003,12
16、00,如用随机数表法,则先在随机数表中选定一个数,如第5行第9列的数字6,从6开始向右连续读取数字,以4个数为一组,遇到右边线时向下错一行向左继续读取,所得数字如下:6438,5482,4622,3162,4309,9006,1844,3253,2383,0130,3046,1943,6248,3469,0253,7887,3239,737l,2845,3445,9493,4977,2261,8442,所抽取的数字如果小于或等于1 200,则对应此号的学生就是被抽取的个体;如果所抽取的数字大于1200,而小于或等于2400,则减去1200,剩余数字即是被抽取的学生号码;如果所抽取的数字大于24
17、00,而小于或等于3600,则减去2400;依此类推如果遇到相同的号码,则只留取第一次读取的数字,其余的舍去,这样被抽取的学生所对应的号码依次是:0438,0682,1022,0762,0709,0606,0644,0853,1183,0130,0646,07430248,1069,0253,0687,0839,0171,0445,1045,1093,0177,1061,0042,一直取足50人为止【变式2】 要从10架钢琴中抽取4架进行质量检验,请你设计抽样方案 【解析】 解法一:(随机数表法) 第一步,将10架钢琴编号,号码是0,1,9 第二步,在随机数表中任选一数作为开始,任选一方向作为
18、读数方向比如,选第3行第6列的数“2”,向右读 第三步,从数“2”开始,向右读,每次读取1位,重复数字只记录一次,依次可得到2,7,6,5 第四步,以上号码对应的4架钢琴就是要抽取的对象 解法二:(抽签法) 第一步,将10架钢琴编号,号码是0,1,9 第二步,将号码分别写在一张纸条上,揉成团,制成号签 第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀 第四步,从袋子中逐个抽取4个号签,并记录上面的编号 第五步,所得号码对应的4架钢琴就是要抽取的对象 【总结升华】 (1)将钢琴编号从0开始,10架钢琴用09就可表示,这样总体中的所有个体可用一位数表示,便于使用随机数表 (2)用抽签法抽样关
19、键是将号签搅匀类型二:系统抽样例4下列抽样中不是系统抽样的是( ) A从号码为115的15个球中任选3个作为样本,先在15号球中用抽签法抽出i0号,再将号码为i0+5,i0+10的球也抽出 B工厂生产的产品,用传送带将产品送入包装车间的过程中,检查人员从传送带上每5 min抽取一件产品进行检验 C弄某项市场调查,规定在商店门口随机地抽一个人进行询问,直到调查到事先规定的调查人数为止 D某电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈 【答案】 C【解析】本题的判定依据是系统抽样方法的特征:系统抽样适用于个体数目较多但均衡的总体判断一种抽样是不是系统抽样,首先看是
20、否在抽样前知道总体是由什么构成的,抽样的方法能否保证每个个体按事先规定的条件等可能入样,再看抽样过程中是否将总体分成了几个均衡的部分,是否在每个部分中进行简单随机抽样 本题C显然不是系统抽样,因为事先不知道总体,抽样方法也不能保证每个个体等可能入样,总体也没有分成均衡的几部分,故C不是系统抽样 【总结升华】系统抽样的特点:适用于总体容量较大的情况;剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系;是等可能抽样,每个个体被抽到的可能性都是nN举一反三: 【变式1】下列抽样中,最适宜用系统抽样法的是( ) A某市的4个区共有2000名学生,且4个区的学生人数之比为3882,从
21、中抽取200名学生做样本 B从某厂生产的2000个电子元件中随机抽取5个做样本 C从某厂生产的2000个电子元件中随机抽取200个做样本 D从某厂生产的20个电子元件中随机抽取5个做样本 【答案】 C 【解析】 A中各区学生有区别,不好分成均衡的几部分,不适宜,B中抽取样本容量太小,不适宜D中总体个数较少,不适宜故选C 【总结升华】系统抽样适合总体容量较大且个体间差异较小的情况例5为了了解某大学一年级新生英语学习的情况,拟从503名大学一年级学生中抽取50名作为样本,如何采用系统抽样方法完成这一抽样? 【思路点拨】由题设条件可知总体的个数为503,样本容量为50,不能整除,可采用随机抽样的方法
22、从总体中剔除3个个体,使剩下的个体数500能被样本容量50整除,然后再采用系统抽样方法进行抽样【解析】 第一步,将503名学生用随机方式编号为1,2,3,503 第二步,用抽签法或随机数表法剔除3个个体,这样剩下500名学生,对剩下的500名学生重新编号为1,2,3,500 第三步,确定分段间隔k,将总体分为50个部分,每一部分包括10个个体,这时,第l部分的个体编号为1,2,10;第2部分的个体编号为11,12,20;依此类推,第50部分的个体编号为491,492,500 第四步:在第1部分用简单随机抽样的方法确定起始的个体编号,例如5 第五步:依次在第2部分,第3部分,第50部分取出号码为
23、15,25,495的个体,这样就得到一个容量为50的样本【总结升华】 总体中的每个个体都必须等可能的入样,为了实现“等距”入样且又等概率,应先剔除,再“分段”,后定起始位采用系统抽样是为了减少工作量,提高其可操作性,减少人为误差举一反三: 【变式1】为了了解某年级学习情况,计划从该年级504名学生中抽取50名学生作为样本,问如何采用系统抽样的方法完成这一抽样?【解析】第一步:将504名学生随机编号为1,2,3,503,504;第二步:用抽签法或者随机数表法,剔除4个个体.这样剩下500名学生,对剩下的500名学生重新编号为1,2,3,500;第三步:由于样本容量与总体容量的比为50:500=1
24、:10,我们可将总体平均分成50部分,其中每一部分包含10 个个体,这样第一部分的个体编号为1,2,3,10;第二部分的个体编号为11,12,13,20;依次类推,第50 部分的个体编号为491,492,493,500;第四步:从1到10号进行简单随机抽样,抽取一个号码,比如是5;第五步,依次在第2部分,第3部分,第50部分,取出号码分别为15,25,35,495.这样就得到了一个样本容量为50的样本.【变式2】某校高中三年级有学生322名,为了了解学生的某种情况,按18的比例抽取一个样本,请用系统抽样的方法进行抽取,并写出抽样过程【解析】因为3228=40余2,故先剔除2名学生,把剩下的32
25、0名学生编号为1,2,3,320把总体分为40个部分,每一个部分都有8个个体,例如第一部分的个体编号为:1,2,3,8然后在第一部分随机抽取一个号码,比如6号,那么从6号开始,每隔8个号码抽取1个,得到号码6,14,22,30,310,318,这样就得到一个容量为40的样本类型三:分层抽样例6在下列问题中,各采用什么抽样方法抽取样本? (1)从20台彩电中抽取4台进行质量检验; (2)科学会堂有32排座位,每排有40个座位(座号为140),一次报告会坐满了听众,会后为听取意见留下了座号为18的所有32名听众进行座谈; (3)光远中学有180名教职工,其中教师136名,管理人员20名,后勤服务人
26、员24名,为征求某项意见,现从中抽取一个容量为15的样本 【答案】 (1)简单随机抽样;(2)系统抽样;(3)分层抽样【解析】 (1)所述问题中总体中的个体数和样本容量均较少,故宜用简单随机抽样法;(2)所述问题具有总体中的个体数较多,且每个个体无明显差异的特点,所以适宜用系统抽样法;(3)所述问题的总体中的个体具有明显差异,即出现了3个层次,因此适宜用分层抽样法 【总结升华】 总体容量较小宜用抽签法;总体容量较大,而样本容量较小宜用随机数表法;总体容量较大,样本容量也较大的宜用系统抽样法;总体是由差异明显的几个层次组成,宜用分层抽样法举一反三:【变式1】 一个单位有职工160人,其中业务人员
27、96人,管理人员40人,后勤服务人员24人,为了了解职工的收入情况,要从中抽取一个容量为20的样本,如何去抽取? 方法一:将160人从1到160编上号,然后将用白纸做成的有1160号的160个号签放入箱内搅匀,最后从中抽取20个签,与签号相同的20个人被选出 方法二:将160人从1至160编号,按编号顺序分成20组,每组8人,令18号为第一组,916号为第二组,153160号为第20组从第一组中用抽签方式抽到一个为k号(1k8),其余组是(k+8n)号(n=1,2,3,19),以此抽取20人 方法三:按20160=18的比例,从业务员中抽取12人,从管理人员中抽取5人,从后勤服务人员中抽取3人
28、,都用简单随机抽样法从各类人员中抽取所需人数,他们合在一起恰好抽到20人 以上的抽样方法,依次是简单随机抽样、分层抽样、系统抽样的顺序是( ) A方法一、方法二、方法三 B方法二、方法一、方法三C方法一、方法三、方法二 D方法三、方法一、方法二【答案】C 例7 一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人,为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取? 【思路点拨】总体由不到35岁、35岁至49岁与50岁及50岁以上的个体构成,个体的差异较大,适合用分层抽样法【
29、解析】 用分层抽样来抽取样本,步骤是: (1)分层按年龄将职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工 (2)确定每层抽取个体的个数抽样比为,则在不到35岁的职工中抽125=25(人); 在35岁至49岁的职工中抽280=56(人); 在50岁及50岁以上的职工中抽95=19(人) (3)在各层分别按抽签法或随机数表法抽取样本 (4)综合每层抽样,组成样本【总结升华】本小题主要考查分层抽样的概念和运算以及抽样过程. 求解总体由差异明显的个体构成的问题时,适合用分层抽样法.分层后,各层的个体数较多时,可采用系统抽样或随机数表法抽取出各层中的个体,一定要注意按比例
30、抽取举一反三:【高清课堂:随机抽样 400439 例1】【变式1】某学院的A,B,C三个专业共有1200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取_名学生【答案】40【变式2】某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1200编号,并按编号顺序平均分为40组(15号,610号,196200号)若第5组抽出的号码为22,则第8组抽出的号码应是_若用分层抽样方法,则40岁以下年龄段应抽取_人【答案】37 20【变式3】某地为了调查职业满意度,决定用分层抽样的方法从公务员、教师、自由职业者三个群体的相关人员中,抽取若干人组成调查小组,有关数据见下表,则调查小组的总人数为 相关人员数抽取人数公务员32x教师48y自由职业者644【解析】采用分层抽样,抽样比为2:3:4,由题可知.则调查小组的总人数为2+3+4=9人,即为9人.