1、专题 19 统计知识及统计案例大题部分【训练目标】1、 理解简单随机抽样每个个体被抽取的概率相等,掌握简单随机抽样,系统抽样,分层抽样的方法和本质;2、 掌握频率分布直方图的画法和性质,能够根据频率分布直方图计算平均数、中位数、众数和方差;3、 能根据茎叶图计算平均数、中位数、众数和方差;4、 能看懂条形图,扇形统计图,雷达图,折线统计图等常见的统计图表;5、 熟记平均数,方差的计算公式及性质,理解平均数,中位数,众数,方差的实际意义;6、 能根据数据和公式求线性回归方程,把握线性回归方程的核心即一定经过样本中心点 ,xy;7、 理解相关系数,残差等概念及相应的含义,并能正确的使用公式求解;8
2、、 会根据数据列 2列联表,掌握利用 2公式进行独立性检验的方法;【温馨小提示】此类问题在高考中属于必考题,一般在大题或者小题中出现,所占分值比重较大,题目容易,但是阅读量大,需要学生能够快速准确的把握题目的核心,同时计算量 也偏大,另外要求学生多加训练,解出各种统计的题型,知晓解题方法。【名校试题荟萃】1、如图,从参 加环保知识竞赛的学生中抽出 名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题: (1) 这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛成绩的平均数、众数、中位数;(不要求写过程)(3)从成绩是 分以上(包括 分)的学生中选两人,求他们在同
3、一分数段的概率【答案】(1)4 (2)68.5、75、70 (3) (3)记“取出的 2 人在同一分数段”为事件 ,因为 之间的人数为 40.1,设为 ,之间有人,设为 ,从这 6 人中选出 2 人,有,,,,共 15 个基本事件,其中事件 A 包括,, , ,共 7 个基本事件,则2、2018 年为我国改革开放 40 周年,某事业单位共有职工 600 人,其 年龄与人数分 布表如下:年龄段 2,3535,445,5,9人数(单位:人) 180 180 160 80约定:此单位 45 岁59 岁为中年人,其余为青年人,现按照分层抽样抽取 30 人作为全市庆祝晚会的观众 (1)抽出的青年观众与中
4、年观众分别为多少人?(2)若所抽取出的青年观众与中年观众中分别有 12 人和 5 人不热衷关心民生大事,其余人热衷关心民生大事完成下列 22 列联表,并回答能否有 90%的把握认为年龄层与热衷关心民生大事有关? 热衷关心民生大事 不热衷关心民生大事 总计青年 12中年 5总计 30(3)若从热衷关心民生大事的青年观众(其中 1 人擅长歌舞,3 人擅长乐器)中,随机抽取 2 人上台表演节目,则抽出的 2 人能胜任才艺表演的概率是多少?【答案】(1)18,12 (2)否 (3) 25【解析】(1)根据分层抽样可知抽出的青年观众为 18 人,中年观众 12 人;(2)22 列联表如下:热衷关 心民生
5、大事 不热衷关心民生大事 总计青年 6 12 18 中年 7 5 12总计 13 17 30,没有 90%的把握认为年龄层与热衷关心民生大事有关;3、随着网络的发展,人们可以在网络上购物、玩游戏、聊天、导航等,所以人们对上网流量的需求越来越大。某电信运营商推出一款新的“流量包”套餐.为了调查不同年龄的人是否愿意选择此款“流量包”套餐,随机抽取 个用户按年龄分组进行访谈,统计结果如下表.(1)若在第 组愿意选择此款“流量包”套餐的人中,用分层抽样的方法抽取 人,则各组应分别抽取多少人;(2)若从第 组的被调查者访谈人中随机选取 人进行追踪调查,求 人中至少有 人愿意选择此款“流量包”套餐的概率;
6、(3)按以上统计数据填写下面 列联表,并判断以 岁为分界点,能否在犯错误不超过 的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关.参考公式:,其中.【答案】(1)各组分别为 人, 人, 人 (2) (3)在犯错误不超过 的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关.【解析】(1)因为,所以第 组愿意选择此款“流量包”套餐的人中,用分层抽样的方法抽取 人,各组分别为 人, 人, 人.(3) 列联表:,在犯错误不超过 的前提下 认为是否愿意选择此款“流量包”套餐与人的年龄有关.4、某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与医院抄录了 至月份每月
7、日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料.该兴趣小组确定的研究方案是:先从这六组数据中选取 组,用剩下的 组数据求线性回归方程,再用被选取的 组数据进行检验.日期 月 日 月 日 月 日 月 日 月 日 月 日昼夜温差 ( )就诊人数 (个)(1)若选取的是 月与 月的两组数据,请根据 至 月份的数据,求出 关于 的线性回归方程 ;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想.(参考公式:)【答案】(1);(2)该小组所得线性回归方程是理想的.5、2018 年 月以来南昌市遭受连日大暴
8、雨天气,某网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.按照南昌暴雨前后两个时间收集有效投票,暴雨后的投票收集了 份,暴雨前的投票也收集了 份,所得统计结果如下表:支持 不支持 总计南昌暴雨后南昌暴雨前总计已知工作人员从所有投票中任取一个,取 到“不支持投入”的投票的概率为 .(1)求列表中数据 的值;(2)能够有多大把握认为南 昌暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关系?参考临界值表:0.15 0.10 0.05 0.025 0.010 0.005 0.0012.072 2.706 3.841 5.024 6.635 7.879 10.828参考公式:(其
9、中为样本容量)【答案】(1) , , , ,(2)有 把握认为南昌暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关系6、在“新零售”模式的背景下,某大型零售公司为推广线下分店,计划在 S市的 A区开设分店,为了确定在该区开设分店的个数,该公司对在该市其他区开设的分店的数据作了初步处理后得到下列表格记x表示在各区开设分店的个数, y表示这 x个分店的年收入之和(个) 2 3 4 5 6y(百万元) 2.5 3 4 4.5 6(1)该公司已经过初步判断,可用线性回归模型拟合 y与 x的关系,求 y关于 x 的线性回归方程axb;(2)假设该公司在 A区获得的总年利润 z(单位:百万元)与 ,
10、之间的关系,请结合(1)中的线性回归方程,估算该公司应在 A区开设多少个分店时,才能使 A区平均每个分店的年利润最大?(参考公式【答案】(1)(2) 4x【解析】(1)代入数据得: , , ,(2)由题意,可知总收入的预报值z与 之间 的关系为:,设该区每个分店的平均利润为 t,则 xz,故t的预报值 与 之间的关系为, 则当 4x时,t取到最大值。7、随着移动互联网的发展,与餐饮美食相关的手机应用软件层出不穷现从使用 A 和 B 两款订餐软件的商家中分别随机抽取 50 个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如下:(1)试估计使用 A 款订餐软件的 50 个商家的“平均送
11、达时间”的众数及平均数;(2)根据以上抽样调查数据, 将频率视为概率,回答下列问题:能否认为使用 B 款订餐软件“平均送达时间”不超过 40 分钟的商家达到 75%?如果你要从 A 和 B 两款订餐软件中选择一款订餐,你会选择哪款?说明理由【答案】 (1)55,40 (2)75%,B8、为了解某地区某种农产品的年产量 x(单位:吨)对价格 y(单位:千元/吨)和年利润 z 的影响,对近五年该农产品的年产量和价格统计如下表:x 1 2 3 4 5y 7.0 6.5 5.5 3.8 2.2(1)求 y 关于 x 的线性回归方程 x ;y b a (2)若每吨该农产品的成本为 2 千元,假设该农产品
12、可全部卖出,预测当年产量为多少时,年利润 z 取到最大值?(保留两位小数)参考公式: , b ni 1 xi x yi y ni 1 xi x 2ni 1xiyi nx y ni 1x2i nx 2 ay b x 【答案】 (1) 1.23 x8.69 (2)2.72y (2)年利润 z x(1.23 x8.69)2 x1.23 x26.69 x1.23 21.23 2(x6.692.46) (6.692.46)即当 x 2.72 时,年利润 z 最大6.692.469、下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图(1)由折线图看出,可用线性回归模型拟合
13、y 与 t 的关系,请用相关系数加以说明;(2)建立 y 关于 t 的回归方程(系数精确到 0.01) ,预测 2016 年我国生活垃圾无害化处理量参考数据: i9.32, iyi40.17, 0.55, 2.646.7i 1y7i 1t7i 1 yi y 2 7参考公式:相关系数 r ,回归方程 t 中斜率和截距的最小二乘估ni 1 ti t yi yni 1 ti t 2ni 1 yi y 2 y a b 计公式分别为 , .b ni 1 ti t yi yni 1 ti t 2 a y b t【答案】 (1)见解析 (2)1.82(2)由 1.331 及(1)得y9.327 0.103,
14、 1.3310.10340.92.b 7i 1 ti t yi y7i 1 ti t 2 2.8928 a y b t所以 y 关于 t 的回归方程为 0.920.10 t.y 将 2016 年对应的 t9 代入回归方程得 0.920.1091.82.y 所以预测 2016 年我国生活垃圾无害化处理量约为 1.82 亿吨10、某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费 x(单位:千元)对年销售量 y(单位:t)和年利润 z(单位:千元)的影响对近 8 年的年宣传费 xi和年销售量 yi( i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值x y w( xi8i 1
15、x) 2( wi8i 1 w) 2( xi )8i 1 x( yi )y( wi )8i 1 w( yi )y46.6 563 6.8 289.8 1.6 1 469 108.8表中 wi , i.xi w188i 1w(1)根据散点图判断, y a bx 与 y c d 哪一个适宜作为年销售量 y 关于年宣传费 x 的回归方程类x型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程(3)已知这种产品的年利润 z 与 x, y 的关系为 z0.2 y x.根据(2)的结果回答下列问题:年宣传费 x49 时,年销售量及年利润的预报值是多少?年宣传
16、费 x 为何值时,年利润的预报值最大?附:对于一组数据( u1, v1) , ( u2, v2) , ( un, vn) ,其回归直线 v u 的斜率和截距的最小二乘估计分别为 , . ni 1 ui u vi vni 1 ui u 2 v u【答案】 (1)详见解析 (2)46.24【解析】(1)由散点图可以判断, y c d 适宜作为年销售量 y 关于年宣传费 x 的回归方程类型x(2)令 w ,先建立 y 关于 w 的线性回归方程x由于 68,d 8i 1 wi w yi y8i 1 wi w 2 108.81.6 563686.8100.6,c y d w所以 y 关于 w 的线性回归
17、方程 100.668 w,y 因此 y 关于 x 的回归方程为 100.668 .y x11、某品牌手机厂商推出新款的旗舰机型,并在某地区跟踪调查得到这款手机上市时间( x 个月)和市场占有率( y%)的几组相关对应数据:x 1 2 3 4 5y 0.02 0.05 0.1 0.15 0.18(1)根据上表中的数据,用最小二乘法求出 y 关于 x 的线性回归方程;(2)根据上述回归方程,分析该款旗舰机型市场占有率的变化趋势,并预测自上市起经过多少个月,该款旗舰机型市场占有率能超过 0.5%(精确到月) 附: , .b ni 1xiyi nx y ni 1x2i nx 2 ay b x 【答案】
18、(1) 0.042 x0.026y (2)13(2)由(1)中的回归方程可知,上市时间与市场占有率正相关,即上市时间每增加 1 个月,市场占有率约增加 0.042 个百分点由 0.042 x0.0260.5,解得 x13,y 故预计上市 13 个月时,该款旗舰机型市场占有率能超过 0.5%.12、某市春节期间 7 家超市的广告费支出 xi(万元)和销售额 yi(万元)数据如下:超市 A B C D E F G广告费支出 xi 1 2 4 6 11 13 19销售额 yi 19 32 40 44 52 53 54(1)若用线性回归模型拟合 y 与 x 的关系,求 y 关于 x 的线性回归方程;(
19、2)用对数回归模型拟合 y 与 x 的关系,可得回归方程 12ln x22,经计算得出线性回归模型和对数y 模型的 R2分别约为 0.75 和 0.97,请用 R2说明选择哪个回归模型更合适,并用此模型预测 A 超市广告费支出为 8 万元时的销售额.参数数据及公式: 8, 42, xiyi2 794, x 708, , x y 7 i 1 7 i 12i b i 1xiyi nx y n i 1x a ,ln 20.7.y b x 【答案】 (1) 1.7 x28.4. ( 2)47.2y 【解析】 (1) 8, 42, xiyi2 794, x 708.x y 7 i 1 7 i 12i 1
20、.7,b i 1xiyi nx y n i 1x 2 794 7842708 782因此 421.7828.4.a y b x 所以, y 关于 x 的线性回归方程是 1.7 x28.4.y (2)0.750.97,对数回归模型更合适.当 x8 时, 12ln 82236ln 222360.72247.2(万元).y 广告费支 出 8 万元时,预测 A 超市销售额为 47.2 万元.13、为了监控某种零件的一条生产线的生产过程,检验员每隔 30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的 16 个零件的尺寸:抽取次序 1 2 3 4 5 6
21、 7 8零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04抽取次序 9 10 11 12 13 14 15 16零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得 xi9.97, sError! 0.212,Error!18.439, ( xi )x 11616 i 1 116( i 1x 16 i 1 x ( i8.5)2.78,其中 xi为抽取的第 i 个零件的尺寸, i1,2,16.(1)求( xi, i) ( i1,2,16)的相关系数 r,并回答是否可以认为这一天生产的零件尺寸不随生产
22、过程的进行而系统地变大或变小(若| r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在( 3 s, 3 s)之外的零件,就认为这条生产线在这一x x 天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?在( 3 s, 3 s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的x x 均值与标准差.(精确到 0.01)附:样本( xi, yi) ( i1,2, n)的相关系数 rError!, 0.09.0.008【答案】 (1)见解析 (2)0.09【解析】(1)由样本数据得( xi, i) ( i1,2,16)的相关系数rError! 0.18. 2.780.2121618.439由于| r|0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.剔除第 13 个数据,剩下数据的样本方差为(1 591.1349.22 21510.02 2)0.008,115这条生产线当天生产的零件尺寸的标准差的估计值为 0.09.0.008