1、2022年中考数学复习专题24:统计图表的应用【一】频率分布直方图 在频率分布直方图中:各小矩形的面积表示相应各组的频率,各小矩形的高;各小矩形面积之和等于1;中位数左右两侧的直方图面积相等,因此可以估计其近似值,为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;众数是最高矩形中点的横坐标;频率分布直方图中均值等于组中值与对应概率乘积的和.1.例题【例1】 我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查通过抽样,获得了某年100位居民每人的月均用水量(单位:吨)将数据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图所示的频率分布直方图
2、 (1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数【解析】(1)由频率分布直方图可知,月均用水量在0,0.5)的频率为0.080.50.04,同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5 组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1(0.040.080.210.250.060.040.02)0.5a0.5a,解得a0.30.(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.060.040.020.12.由以上样本的
3、频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 0000.1236 000.(3)设中位数为x吨因为前5组的频率之和为0.040.080.150.210.250.730.5,而前4组的频率之和为0.040.080.150.210.480.5,所以2 x2.5.由0.50(x2)0.50.48,解得x2.04.故可估计居民月均用水量的中位数为2.04吨【例2】(2019年高考全国卷文数)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液每只小鼠给服的溶液体积相同、摩尔浓度相同
4、经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)【解析】(1)由已知得,故(2)甲离子残留百分比的平均值的估计值为乙离子残留百分比的平均值的估计值为2.巩固提升综合练习【练习1】某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人),现用分层抽样方法(按A类、B类分二层
5、)从该工厂的工人中共抽查100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数)()求甲、乙两工人都被抽到的概率,其中甲为A类工人,乙为B类工人;()从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2表1:生产能力分组100,110)110,120)120,130)130,140)140,150)人数48x53表2生产能力分组110,120)120,130)130,140)140,150)人数6y3618(i)先确定x,y,再在答题纸上完成下列频率分布直方图就生产能力而言,A类工人中个体间的差异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回
6、答结论)图1 A类工人生产能力的频率分布直方图 图2 B类工人生产能力的频率分布直方图(ii)分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表)【解析】()甲乙被抽到的概率都是,而且事件“甲工人被抽到”与“乙工人被抽到”相互独立,所以甲、乙两工人都被抽到的概率A类工人中和B类工人中分别抽查25名和75名()(i)由48x5325,得x5;6y361875,得y15频率分布直方图如下图1 A类工人生产能力的频率分布直方图图2 B类工人生产能力的频率分布直方图从直方图可以判断:B类工人中个体间的差异程度更小.A类工人生产能力的平
7、均数,B类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1【练习2】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:20,30),30,40),80,90,并整理得到如下频率分布直方图:()从总体的400名学生中随机抽取一人,估计其分数小于70的概率;()已知样本中分数小于40的学生有5人,试估计总体中分数在区间40,50)内的人数;()已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等试估计总体中男生和女生人数的比例【解析】(1)由
8、频率分布直方图知,分数在的频率为,分数在的频率为,则分数小于70的频率为,故从总体的400名学生中随机抽取一人,估计其分数小于70的概率为0.4.(2)由频率分布直方图知,样本中分数在区间的人数为 (人),已知样本中分数小于40的学生有5人,所以样本中分数在区间内的人数为 (人),设总体中分数在区间内的人数为,则,得,所以总体中分数在区间内的人数为20人.(3)由频率分布直方图知,分数不小于70的人数为 (人),已知分数不小于70的男女生人数相等,故分数不小于70分的男生人数为30人,又因为样本中有一半男生的分数不小于70,故男生的频率为: 0.6,即女生的频率为: 0.4,即总体中男生和女生
9、人数的比例约为:3:2.【练习3】某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:,后得到如图的频率分布直方图 (1)求图中实数的值;(2)若该校高一年级共有学生640人,试估计该校高一年级期中考试数学成绩不低于60分的人数;(3)若从数学成绩在与两个分数段内的学生中随机选取两名学生,求这两名学生的数学成绩之差的绝对值不大于10的概率【解析】(1)由于图中所有小矩形的面积之和等于1,所以 解得 (2)根据频率分布直方图,成绩不低于60分的频率为 由于该校高一年级共有学生640人,利用样本估计总体的思想,可估计该校高一年级数学
10、成绩不低于60分的人数约为人 (3)成绩在分数段内的人数为人,分别记为, 成绩在分数段内的人数为人,分别记为,若从数学成绩在与两个分数段内的学生中随机选取两名学生,则所有的基本事件有:,共15种 如果两名学生的数学成绩都在分数段内或都在分数段内,那么这两名学生的数学成绩之差的绝对值一定不大于10.如果一个成绩在分数段内,另一个成绩在分数段内,那么这两名学生的数学成绩之差的绝对值一定大于10记“这两名学生的数学成绩之差的绝对值不大于10”为事件,则事件包含的基本事件有:,共7种 所以所求概率为 【练习4】某市民用水拟实行阶梯水价每人用水量中不超过立方米的部分按4元/立方米收费,超出立方米的部分按
11、10元/立方米收费从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:()如果为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,至少定为多少?()假设同组中的每个数据用该组区间的右端点值代替当=3时,估计该市居民该月的人均水费【解析】(I)由用水量的频率分布直方图知,该市居民该月用水量在区间,内的频率依次为,所以该月用水量不超过立方米的居民占%,用水量不超过立方米的居民占%依题意,至少定为(II)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:组号12345678分组频率根据题意,该市居民该月的人均水费估
12、计为:(元)【二】茎叶图的应用 茎叶图1、当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图2、当数据有三位有效数字,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推)3、通过茎叶图可观察出平均数、众数、中位数,数据分布的对称性等等,由于茎叶图保留了原始数据,还可计算平均数、方差、标准差1.例题【例1】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为A. 3
13、,5 B. 5,5 C. 3,7 D. 5,7 【答案】A【解析】由已知中甲组数据的中位数为65,故乙数据的中位数为65,即y=5,可得乙数据的平均数为66,即甲数据的平均数为66,故56+62+65+70+x+745=66, x=3,故选A.【例2】某学校A、B两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比较两个班兴趣小组成绩的平均值及标准差.A班兴趣小组的平均成绩高于B班兴趣小组的平均成绩;B班兴趣小组的平均成绩高于A班兴趣小组的平均成绩;A班兴趣小组成绩的标准差大于B班兴趣小组成绩的标准差;B班兴趣小组成绩的标准差大于A班兴趣小组成绩的标准差.其中正确结论的编号为()A.
14、 B. C. D.【答案】A【解析】A班兴趣小组的平均成绩为53+62+64+92+9515=78,其方差为115(53-78)2+(62-78)2+(95-78)2=121.6, 则其标准差为121.611.03;B班兴趣小组的平均成绩为45+48+51+9115=66,其方差为115(45-66)2+(48-66)2+(91-66)2=175.2, 则其标准差为175.213.24.故选A.【例3】随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取两
15、名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率【解析】(1)由茎叶图观察或计算可得乙班的平均身高较高;(2)甲班的平均身高为170(cm),样本方差为572;(3)从乙班随机抽取两名身高不低于173cm的同学共有10种不同的取法:(173,176)(173,178)(173,179)(173,181)(176,178)(176,179)(176,181)(178,179)(178,181)(179,181),设A表示随机事件“抽到身高为176cm的同学”,则A中的事件有4个,所求概率2.巩固提升综合练习【练习1】 某兄弟俩都推销某一小家电,现抽取他们其中8天的销售量(单位:
16、台),得到的茎叶图如图所示,已知弟弟的销售量的平均数为34,哥哥的销售量的中位数比弟弟的销售量的众数大2,则x+y的值为.【答案】13【解析】根据茎叶图中的数据知,弟弟的销售量的众数是34,则哥哥的销售量的中位数是34+2=36,x+72=36-30, 解得x=5,又(27+20+y+34+34+34+32+42+41)8=34, 解得y=8,x+y=5+8=13.【练习2】从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图如图所示根据茎叶图,下列描述正确的是( ) A甲种树苗的高度的中位数大于乙种树苗高度的中位数,且甲种树苗比乙种树苗长得整齐B甲种树苗的高度的中位数大于乙种树苗高度的中位数
17、,但乙种树苗比甲种树苗长得整齐C乙种树苗的高度的中位数大于甲种树苗高度的中位数,且乙种树苗比甲种树苗长得整齐D乙种树苗的高度的中位数大于甲种树苗高度的中位数,但甲种树苗比乙种树苗长得整齐【答案】D【解析】从茎叶图的数据可以看出甲种树苗的平均高度为27,乙种树苗的平均高度为30,因此乙种树苗的平均高度大于甲种树苗的平均高度又从茎叶图分析知道,甲种树苗的高度集中在20到30之间,因此长势更集中【练习3】甲、乙两名同学在 6 次数学考试中,所得成绩用茎叶图表示如下,若甲、乙两人这 6 次考试的平均成绩分别用 表示,则下列结论正确的是( ) A ,且甲成绩比乙成绩稳定B B ,且乙成绩比甲成绩稳定C
18、,且甲成绩比乙成绩稳定D D,且乙成绩比甲成绩稳定【答案】C【解析】从茎叶图提取两个人的成绩,分别求出两个人的平均分,得到甲的平均数比乙的平均数要低,但甲数据比较集中,所以成绩比较稳定.,所以,因为甲数据比较集中,所以成绩比较稳定.【三】其它类型的统计图表 频率分布折线图:连结频率分布直方图各个长方形上边的中点,就得到频率分布折线图总体密度曲线:随着样本容量的增加,分组的组距不断缩小,相应的频率分布折线图就会越来越接近于一条光滑曲线,这条光滑曲线就叫做总体密度曲线总体密度曲线精确地反映了一个总体在各个区域内取值的规律散点图:两个变量的关系可通过它们所对应的点在平面上表现出来,这些点对应的图形叫
19、做散点图【例1】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图根据该折线图,下列结论错误的是()A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在7,8月D各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳【答案】A【解析】根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A错误【例2】已知随机变量,其正态分布密度曲线如图所示,若向长方形中随机投掷1点,则该点恰好落在阴影部分的概率为( ) 附:若随机变量
20、,则,.A0.1359B0.7282C0.8641D0.93205【答案】D【解析】由题意,根据正态分布密度曲线的对称性,可得:,故所求的概率为.故选D.【例3】 图1是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1、A2、Am(如A2表示身高(单位:cm)在150,155)内的学生人数)图2是统计图1中身高在一定范围内学生人数的一个算法流程图现要统计身高在160180cm(含160cm,不含180cm)的学生人数,那么在流程图中的判断框内应填写的条件是_ 图1 图2【答案】i 8或i 7【解析】条形图的横坐标是身高,纵坐标为每个身高区间内的人数条形图没
21、有提供具体的数据信息程序框图的算法含义是统计160,180)内学生人数,即求A4A5A6A7的和2.巩固提升综合练习【练习1】是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即日均值在以下空气质量为一级,在空气量为二级,超过为超标如图是某地12月1日至10日的(单位:)的日均值,则下列说法不正确的是( )A这天中有天空气质量为一级B从日到日日均值逐渐降低C这天中日均值的中位数是D这天中日均值最高的是月日【答案】C【解析】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A正确;从图可知从日到日日均值逐渐降低,所以B正确;从图可知,这天中日均值最高的是月日,所以D正确;由图可知
22、,这天中日均值的中位数是,所以C不正确;故选C.【练习2】 某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A结伴步行,B自行乘车,C家人接送,D其他方式,并将收集的数据整理绘制成如下两幅不完整的统计图.根据图中信息,可知本次抽查的学生中A类人数是()A.30 B.40 C.42 D.48【答案】A【解析】根据选择D方式的有18人,占15%,得总人数为1815%=120,故选择A方式的人数为120-42-30-18=30.【练习3】某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图图中A点表示十月的平均最高气温约为15
23、,B点表示四月的平均最低气温约为5下面叙述不正确的是A各月的平均最低气温都在0以上 B七月的平均温差比一月的平均温差大C三月和十一月的平均最高气温基本相同 D平均最高气温高于20的月份有5个【答案】D【解析】由图可知0在虚线框内,所以各月的平均最低气温都在0以上,A正确;由图可知七月的平均温差比一月的平均温差大,B正确;由图可知三月和十一月的平均最高气温都约为10,基本相同,C正确;由图可知平均最高气温高于20的月份不是5个,D不正确,故选D课后自我检测1某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1200编号,并按编号顺序平均分为40组(
24、15号,610号,196200号)若第5组抽出的号码为22,则第8组抽出的号码应是_,若用分层抽样方法,则40岁以下年龄段应抽取_人【答案】 37;20【解析】由已知系统抽样的组距为5,所以相邻组间的号码相差5;由饼形图可知200名职工中,50岁以上人数:4050岁人数:40岁以下人数235,总样本为40人,分层抽样抽取每层人数比例为2352某位教师2017年的家庭总收入为80 000元,各种用途占比统计如下面的折线图.2018年收入的各种用途占比统计如下面的条形图,已知2018年的就医费用比2017年增加了4 750元,则该教师2018年的家庭总收入为()A.100 000元 B.95 00
25、0元 C.90 000元 D.85 000元【答案】D【解析】由已知得,2017年的就医费用为80 00010%=8 000元,故2018年的就医费用为12 750元,所以该教师2018年的家庭总收入为12 75015%=85 000(元).故选D.3(2018全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例得到如下饼图:则下面结论中不正确的是( )A 新农村建设后,种植收入减少 B 新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三
26、产业收入的总和超过了经济收入的一半【答案】A【解析】通解 设建设前经济收入为,则建设后经济收入为,则由饼图可得建设前种植收入为,其他收入为,养殖收入为建设后种植收入为,其他收入为,养殖收入为,养殖收入与第三产业收入的总和为,所以新农村建设后,种植收入减少是错误的故选A优解 因为,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的4某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20), 20,22.5), 22.5,25),25,27.5),27.5,30)根据直方图,这200名学生中每周
27、的自习时间不少于22.5小时的人数是( )A56 B60 C120 D140【答案】D【解析】自习时间不少于22.5小时的有,故选D5高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下,甲、乙、丙为该班三位学生从这次考试成绩看,在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ;在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 【答案】乙 ; 数学 【解析】由图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙由图可知,比丙的数学成绩排名还靠后的人比较多;而总成绩的排名中比丙排名靠后的人数比较少,所
28、以丙的数学成绩的排名更靠前,故填数学62019年春节期间,我国高速公路继续执行“节假日高速免费政策”.某路桥公司为掌握春节期间车辆出行的高峰情况,在某高速收费点处记录了大年初三上午9:2010:40这一时间段内通过的车辆数,统计发现这一时间段内共有600辆车通过该收费点,它们通过该收费点的时刻的频率分布直方图如图所示,其中时间段9:209:40记作区间,9:4010:00记作,10:0010:20记作,10:2010:40记作.比方:10点04分,记作时刻64. (1)估计这600辆车在9:2010:40时间段内通过该收费点的时刻的平均值(同一组中的数据用该组区间的中点值代表);(2)为了对数
29、据进行分析,现采用分层抽样的方法从这600辆车中抽取10辆,再从这10辆车中随机抽取4辆,记为9:2010:00之间通过的车辆数,求的分布列与数学期望;(3)由大数据分析可知,车辆在春节期间每天通过该收费点的时刻服从正态分布,其中可用这600辆车在9:2010:40之间通过该收费点的时刻的平均值近似代替,可用样本的方差近似代替(同一组中的数据用该组区间的中点值代表),已知大年初五全天共有1000辆车通过该收费点,估计在9:4610:40之间通过的车辆数(结果保留到整数).参考数据:若,则,.【解析】(1)这600辆车在9:2010:40时间段内通过该收费点的时刻的平均值为,即10点04分.(2
30、)结合频率分布直方图和分层抽样的方法可知:抽取的10辆车中,在10:00前通过的车辆数就是位于时间分组中在这一区间内的车辆数,即,所以的可能取值为0,1,2,3,4.所以,所以的分布列为01234所以.(3)由(1)可得, ,所以.估计在9:4610:40这一时间段内通过的车辆数,也就是通过的车辆数,由,得 ,所以,估计在9:4610:40这一时间段内通过的车辆数为(辆).7(2018全国卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量频数13249265使用了节水龙头50天的
31、日用水量频数分布表日用水量频数151310165(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)【解析】(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35的频率为0.20.1+10.1+2.60.1+20.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35的概率的估计值为0.48(3)该家庭未使用节水龙头50天日用水量的平均数为该家庭使用了节水龙头后50天日用水
32、量的平均数为估计使用节水龙头后,一年可节省水8我国已进入新时代中国特色社会主义时期,人民生活水平不断提高某市随机统计了城区若干户市民十月人均生活支出比九月人均生活支出增加量(记为P元)的情况,并根据统计数据制成如图频率分布直方图(1)根据频率分布直方图估算P的平均值;(2)若该市城区有4户市民十月人均生活支出比九月人均生活支出分别增加了42元,50元,52元,60元,从这4户中随机抽取2户,求这2户P值的和超过100元的概率【解析】(1)根据频率分布直方图估算的平均值:(2)该市城区有4户市民十月人均生活支出比九月人均生活支出分别增加了42元,50元,52元,60元,从这4户中随机抽取2户,基
33、本事件总数,这2户值的和超过100元包含的基本事件有,共4个,这2户值的和超过100元的概率9. 从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307308 310 314 319 323 325 325 328 331 334 337 352乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318320 322 322 324 327 329 331 333 336 337 343 356由以上数据设计了如下茎叶图根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:_;_【解析】(可任选两个作答)(1)乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度;(2)甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散(或乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中);(3)甲品种棉花的纤维长度的中位数为307mm,乙品种棉花的纤维长度的中位数为318mm;(4)乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近),甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀;