1、2.2.1用样本的频率分布估计总体分布知识点一 频率分布直方图与茎叶图1为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:1075,1085),3;1085,1095),9;1095,1105),13;1105,1115),16;1115,1125),26;1125,1135),20;1135,1145),7;1145,1155),4;1155,1165,2(1)列出频率分布表;(2)画出频率分布直方图以及频率分布折线图;(3)据上述图表,估计数据落在1095,1135)范围内的可能性是百分之几;(4)数据小于1120的可能性是百分之几?解(1)频率分布表如下:分
2、组频数频率1075,1085)30031085,1095)90091095,1105)130131105,1115)160161115,1125)260261125,1135)20020续表分组频数频率1135,1145)70071145,1155)40041155,11652002合计100100(2)频率分布直方图及频率分布折线图如图所示(3)由上述图表可知数据落在1095,1135)范围内的频率为1(003009)(007004002)075,即数据落在1095,1135)范围内的可能性是75%(4)数据小于1120的可能性即数据小于1120的频率,即为(003009013016)026
3、054,从而估计出数据小于1120的可能性是54%2甲、乙两个小组各10名学生的英语口语测试成绩(单位:分)如下:甲组:76908486818786828583乙组:82848589798091897974用茎叶图表示两个小组的成绩,并判断哪个小组的成绩更整齐一些解茎叶图如图所示由茎叶图容易看出,甲组的成绩是对称的,叶的分布有集中在茎8上,乙组的成绩也大致对称,叶的分布有集中在茎8上,从叶在茎上的分布情况看,甲组的成绩更整齐一些知识点二 用样本的频率分布估计总体分布3某工厂对一批产品进行了抽样检测如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是96,10
4、6,样本数据分组为96,98),98,100),100,102),102,104),104,106已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A90 B75 C60 D45答案A解析产品净重小于100克的频率为(00500100)20300,已知样本中产品净重小于100克的个数是36,设样本容量为n,则0300,所以n120,净重大于或等于98克并且小于104克的产品的个数是120075904为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午8:0012:00间各自的车流量(单位:百辆),得如图所示的茎叶图,试求:(1
5、)甲、乙两个交通站的车流量的极差分别是多少?(2)甲交通站的车流量在10,40间的频率是多少?(3)甲、乙两个交通站哪个站更繁忙?并说明理由解(1)甲交通站的车流量的极差为73865(百辆),乙交通站的车流量的极差为71566(百辆)(2)甲交通站的车流量在10,40间的频率为(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方,从数据的分布情况来看,甲交通站更繁忙一、选择题1已知样本:10861013810121178911912910111212那么频率为03的范围是()A5575 B7595C95115 D115135答案B解析样本容量为20样本数据在5575范
6、围内的有2个,频率为01;在7595范围内的有6个,频率为03;在95115范围内的有7个,频率为035;在115135范围内的有5个,频率为0252将样本数据按某标准分组,并制成频率分布直方图,已知样本数据在其中一组m,n)中的频率为p,且该组在频率分布直方图上的高为h,则|mn|等于()A BCph D与h,p无关答案A解析小矩形的面积等于这一组的频率,小矩形的高等于每一组的,则组距等于频率除以高,即|mn|故选A3从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如图所示(单位:cm)根据数据估计()A甲种玉米比乙种玉米不仅长得高而且长得整齐B乙种玉米比甲种玉米不仅长得高而且长得整齐C甲种
7、玉米比乙种玉米长得高但长势没有乙整齐D乙种玉米比甲种玉米长得高但长势没有甲整齐答案D解析由题中的茎叶图可知,甲种玉米的株高集中在20 cm段,乙种玉米的株高集中在30 cm和40 cm段,则甲种玉米的平均株高小于乙种玉米的平均株高,但乙种玉米的株高较分散,故选D4从某小区抽取100户居民进行月用电量调查,为制定阶梯电价提供数据,发现其月用电量都在50到350度之间,制作频率分布直方图(如图所示)的工作人员粗心大意,位置t处未标明数据,则t()A00041 B00042 C00043 D00044答案D解析由题意得50(0006t0003600024200012)1,故t00044故选D5为了解
8、某校学生的视力情况,随机抽查了该校的100名学生,得到如下图所示的频率分布直方图由于不慎将部分数据丢失,但知道前4组的频数和为40,后6组的频数和为87设最大频率为a,视力在45到52之间的学生人数为b,则a,b的值分别为()A027096 B02796C27096 D2796答案B解析由频率分布直方图知组距为01,由前4组的频数和为40,后6组的频数和为87,知第4组的频数为408710027,即视力在46到47之间的频数最大,为27,故最大频率a027视力在45到52之间的频率为1001003096,故视力在45到52之间的学生人数b09610096二、填空题6某电子商务公司对10000名
9、网络购物者2018年度的消费情况进行统计,发现消费金额(单位:万元)都在区间03,09内,其频率分布直方图如图所示(1)直方图中的a_;(2)在这些购物者中,消费金额在区间05,09内的购物者的人数为_答案(1)3(2)6000解析由频率分布直方图及频率和等于1可得0201080115012012501a011,解得a3,消费金额在区间05,09内的频率为0201080120130106,所以消费金额在区间05,09内的购物者的人数为061000060007在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如下图所示若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,
10、则其中成绩在区间139,151上的运动员人数是_答案4解析由题知,用系统抽样方法抽取7人,则要把数据分为七组:第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在139,151上的恰有4组,故有4人三、解答题8某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包,称其质量,分
11、别记下数据:如下表(单位:千克):甲52514948534849乙60654035256560(1)这种抽样方法是哪一种抽样方法?(2)画出茎叶图,并说明哪个车间的产品比较稳定解(1)由于是每隔30分钟抽取一包产品,是等间隔抽取,属于系统抽样(2)以十位数为茎,个位数为叶,画出茎叶图,如图所示甲车间数据比较集中,故甲车间的产品比较稳定9为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如下图),图中从左到右各小长方形面积之比为24171593,第二小组频数为12(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110
12、次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由解(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为008又频率,所以样本容量150,即第二小组的频率为008,样本容量是150(2)由图可估计该学校高一学生的达标率约等于次数落在110,150内的频率,又100%88%,即次数落在110,150内的频率为88%,所以估计该学校全体高一学生的达标率是88%(3)由已知可得各小组的频数依次为1506,15012,15051,15045,15027,1509,即各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114所以跳绳次数的中位数落在第四小组内