1、概率与统计热点问题(解题指导)三年考情分析热点预测 真题印证 核心素养统计图表 2018,3 数学抽象、数据分析二项分布 2018,20;2017,19 数学运算、数据分析分布列、期望 2017,18;2016,19 数学运算、数据分析正态分布 2017,19 数据分析条件概率 2016,18 数据分析回归分析 2018,18;2016,18 直观想象、数据分析独立性检验 2018,18;2017,18 数据分析审题答题指引1.教材与高考对接统计图表、独立性检验【题根与题源】(必修 3P70 茎叶图)某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:甲运动员得分:13,51,23,8,26
2、,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.绘制甲乙两名运动员得分的茎叶图,根据茎叶图判断哪名运动员的成绩更好?并说明理由.【试题评析】统计的基本思想是由样本来估计总体,根据茎叶图能够用样本的数字特征估计总体的数字特征,从而作出统计推断.【教材拓展】甲、乙两名同学在 7 次数学测试中的成绩如茎叶图所示,其中甲同学成绩的众数是 85,乙同学成绩的中位数是 83,试分析甲乙两名同学哪个一个成绩较稳定.【探究提高】(2018全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为
3、比较两种生产方式的效率,选取 40 名工人,将他们随机分成两组,每组 20 人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位: min)绘制了如图所示的茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求 40 名工人完成生产任务所需时间的中位数 m,并将完成生产任务所需时间超过 m 和不超过 m 的工人数填入下面的列联表:超过 m 不超过 m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有 99%的把握认为两种生产方式的效率有差异?附:K 2 ,n(ad bc)2(a b)(c d)(a c)(b d)P(K2
4、k 0) 0.050 0.010 0.001k0 3.841 6.635 10.8282.教你如何审题回归分析问题【例题】 如图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨) 的折线图.注:年份代码 17 分别对应年份 20082014.(1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加以说明;(2)建立 y 关于 t 的回归方程(系数精确到 0.01),预测 2020 年我国生活垃圾无害化处理量.附注:参考数据: yi9.32, tiyi40.17, 0.55, 2.646.7 i 1 7 i 1 7 i 1(yi y )2 7参考公式:相关
5、系数 r , n i 1(ti t )(yi y ) n i 1(ti t )2 n i 1(yi y )2回归方程 t 中斜率和截距的最小二乘估计公式分别为:y a b , .b n i 1(ti t )(yi y ) n i 1(ti t )2 a y b t 【审题路线】【自主解答】【探究提高】在两个变量的回归分析中要注意以下两点:(1)求回归直线方程要充分利用已知数据,合理利用公式减少运算.(2)借助散点图,观察两个变量之间的关系.若不是线性关系,则需要根据相关知识转化为线性关系.【尝试训练】 某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第 x 年与年销售
6、量 y(单位:万件)之间的关系如表:x 1 2 3 4y 12 28 42 56(1)在图中画出表中数据的散点图;(2)根据散点图选择合适的回归模型拟合 y 与 x 的关系(不必说明理由);(3)建立 y 关于 x 的回归方程,预测第 5 年的销售量.参考公式:回归直线 x 的斜率和截距的最小二乘估计分别为 , .b n i 1(xi x )(yi y ) n i 1(xi x )2 a y b x 3.满分答题示范分布列、期望、方差问题【例题】 (12 分)(2017 全国卷) 某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶 4 元,售价每瓶 6 元,未售出的酸奶降价处理,以每瓶
7、2 元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:) 有关.如果最高气温不低于25,需求量为 500 瓶;如果最高气温位于区间20,25) ,需求量为 300 瓶;如果最高气温低于 20,需求量为 200 瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温 10,15) 15,20) 20,25) 25,30) 30,35) 35,40)天数 2 16 36 25 7 4以最高气温位于各区间的频率估计最高气温位于该区间的概率.(1)求六月份这种酸奶一天的需求量 X(单位:瓶)的分布列;(2)设六月份一天销售这种酸奶的利润
8、为 Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶) 为多少时,Y 的数学期望达到最大值?【规范解答】4.高考状元满分心得得步骤分:抓住得分点的步骤、步步为赢:如第(1)问,指出随机变量 X 所有的可能取值,有则得 1 分,无则没有分;随机变量 X 的各个值对应的概率也是每个 1 分,列出其分布列是 1 分,每个步骤都有分,都是得分点,第(2)问也是如此 .得关键分:解题过程的关键点,有则给分,无则没分,如第(2)问中,根据 n 的范围求E(Y),即当 300n500 时,E(Y) 6402n;当 200n300 时,E(Y) 1601.2n,若这两个关键运算结果有误,即使有计算过程
9、和步骤也不得分.得计算分:解题过程中计算正确,是得满分的保证,如第(1)问中三个概率值的计算要正确,否则不得分.【构建模板】【规范训练】 (2018佛山模拟 )某公司为招聘新员工设计了一个面试方案:应聘者从6 道备选题中一次性随机抽取 3 道题,按照题目要求独立完成.规定:至少正确完成其中 2道题的便可通过.已知 6 道备选题中应聘者甲有 4 道题能正确完成,2 道题不能完成;应聘者乙每题正确完成的概率都是 ,且每题正确完成与否互不影响.23(1)分别求甲、乙两人正确完成面试题数的分布列及数学期望;(2)请分析比较甲、乙两人谁面试通过的可能性大?2019 年高考数学六大题解满分解题技巧秘籍专题
10、 11 概率与统计热点问题(解题指导)三年考情分析热点预测 真题印证 核心素养统计图表 2018,3 数学抽象、数据分析二项分布 2018,20;2017,19 数学运算、数据分析分布列、期望 2017,18;2016,19 数学运算、数据分析正态分布 2017,19 数据分析条件概率 2016,18 数据分析回归分析 2018,18;2016,18 直观想象、数据分析独立性检验 2018,18;2017,18 数据分析审题答题指引1.教材与高考对接统计图表、独立性检验【题根与题源】(必修 3P70 茎叶图)某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:甲运动员得分:13,51,23,
11、8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.绘制甲乙两名运动员得分的茎叶图,根据茎叶图判断哪名运动员的成绩更好?并说明理由.【试题评析】统计的基本思想是由样本来估计总体,根据茎叶图能够用样本的数字特征估计总体的数字特征,从而作出统计推断.【教材拓展】甲、乙两名同学在 7 次数学测试中的成绩如茎叶图所示,其中甲同学成绩的众数是 85,乙同学成绩的中位数是 83,试分析甲乙两名同学哪个一个成绩较稳定.解 根据众数及中位数的概念易得 x5,y3,故甲同学成绩的平均数为 85,78 79 80 85 85 9
12、2 967乙同学成绩的平均数为 85,72 81 81 83 91 91 967故甲同学成绩的方差为 (49362549121) 40,17乙同学成绩的方差为 (169161643636121) 40,17 3987故成绩较稳定的是甲.【探究提高】(2018全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取 40 名工人,将他们随机分成两组,每组 20 人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位: min)绘制了如图所示的茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高
13、?并说明理由;(2)求 40 名工人完成生产任务所需时间的中位数 m,并将完成生产任务所需时间超过 m 和不超过 m 的工人数填入下面的列联表:超过 m 不超过 m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有 99%的把握认为两种生产方式的效率有差异?附:K 2 ,n(ad bc)2(a b)(c d)(a c)(b d)P(K2k 0) 0.050 0.010 0.001k0 3.841 6.635 10.828解:(1)第一种生产方式时间集中在区间80 ,90,且平均工作时间 184.x 第二种生产方式的时间集中在区间70,80) ,且平均工作时间 274.7.x 1 2
14、,所以第一种生产方式完成任务的平均时间大于第二种,x x 第二种生产方式的效率更高.(2)由茎叶图数据得到 m80.由此填写列联表如下:超过 m 不超过 m 总计第一种生产方式 15 5 20第二种生产方式 5 15 20总计 20 20 40(3)根据(2)中的列联表计算.K2 106.635,所以有 99%的把握n(ad bc)2(a b)(c d)(a c)(b d) 40(1515 55)220202020认为两种生产方式的效率有差异.2.教你如何审题回归分析问题【例题】 如图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨) 的折线图.注:年份代码 17 分别对应
15、年份 20082014.(1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加以说明;(2)建立 y 关于 t 的回归方程(系数精确到 0.01),预测 2020 年我国生活垃圾无害化处理量.附注:参考数据: yi9.32, tiyi40.17, 0.55, 2.646.7 i 1 7 i 1 7 i 1(yi y )2 7参考公式:相关系数 r , n i 1(ti t )(yi y ) n i 1(ti t )2 n i 1(yi y )2回归方程 t 中斜率和截距的最小二乘估计公式分别为:y a b , .b n i 1(ti t )(yi y ) n i 1(ti
16、 t )2 a y b t 【审题路线】【自主解答】解 (1)由折线图中数据和附注中参考数据得4, (ti )228, 0.55.t 7 i 1 t 7 i 1(yi y )2(ti )(yi ) tiyi yi40.1749.32 2.89,7 i 1 t y 7 i 1 t 7 i 1r 0.99.2.8922.6460.55因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当高,从而可以用线性回归模型拟合 y 与 t 的关系.(2)由 1.331 及(1) 得 0.10,y 9.327 b 7 i 1(ti t )(yi y ) 7 i 1(ti t )2
17、2.8928 1.3310.10340.92.a y b t 所以 y 关于 t 的回归方程为 0.920.10t.y 将 2020 年对应的 t13 代入回归方程得 0.920.10132.22.y 所以预测 2020 年我国生活垃圾无害化处理量将约为 2.22 亿吨.【探究提高】在两个变量的回归分析中要注意以下两点:(1)求回归直线方程要充分利用已知数据,合理利用公式减少运算.(2)借助散点图,观察两个变量之间的关系.若不是线性关系,则需要根据相关知识转化为线性关系.【尝试训练】 某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第 x 年与年销售量 y(单位:万件
18、)之间的关系如表:x 1 2 3 4y 12 28 42 56(1)在图中画出表中数据的散点图;(2)根据散点图选择合适的回归模型拟合 y 与 x 的关系(不必说明理由);(3)建立 y 关于 x 的回归方程,预测第 5 年的销售量.参考公式:回归直线 x 的斜率和截距的最小二乘估计分别为 , .b n i 1(xi x )(yi y ) n i 1(xi x )2 a y b x 解 (1)作出的散点图如图:(2)根据散点图观察,可以用线性回归模型拟合 y 与 x 的关系.观察散点图可知各点大致分布在一条直线附近,列出表格:x y x2 xy1 1 12 1 122 2 28 4 563 3
19、 42 9 1264 4 56 16 224 10 138 30 418可得 , ,x 52 y 692所以 ,b 418 45269230 4(52)2 735 2.a y b x 692 735 52故回归直线方程为 x2.y 735(3)当 x5 时, 5271.y 735故预测第 5 年的销售量大约为 71 万件.3.满分答题示范分布列、期望、方差问题【例题】 (12 分)(2017 全国卷) 某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶 4 元,售价每瓶 6 元,未售出的酸奶降价处理,以每瓶 2 元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:)
20、 有关.如果最高气温不低于25,需求量为 500 瓶;如果最高气温位于区间20,25) ,需求量为 300 瓶;如果最高气温低于 20,需求量为 200 瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温 10,15) 15,20) 20,25) 25,30) 30,35) 35,40)天数 2 16 36 25 7 4以最高气温位于各区间的频率估计最高气温位于该区间的概率.(1)求六月份这种酸奶一天的需求量 X(单位:瓶)的分布列;(2)设六月份一天销售这种酸奶的利润为 Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶) 为多少时,Y 的
21、数学期望达到最大值?【规范解答】4.高考状元满分心得得步骤分:抓住得分点的步骤、步步为赢:如第(1)问,指出随机变量 X 所有的可能取值,有则得 1 分,无则没有分;随机变量 X 的各个值对应的概率也是每个 1 分,列出其分布列是 1 分,每个步骤都有分,都是得分点,第(2)问也是如此 .得关键分:解题过程的关键点,有则给分,无则没分,如第(2)问中,根据 n 的范围求E(Y),即当 300n500 时,E(Y) 6402n;当 200n300 时,E(Y) 1601.2n,若这两个关键运算结果有误,即使有计算过程和步骤也不得分.得计算分:解题过程中计算正确,是得满分的保证,如第(1)问中三个
22、概率值的计算要正确,否则不得分.【构建模板】【规范训练】 (2018佛山模拟 )某公司为招聘新员工设计了一个面试方案:应聘者从6 道备选题中一次性随机抽取 3 道题,按照题目要求独立完成.规定:至少正确完成其中 2道题的便可通过.已知 6 道备选题中应聘者甲有 4 道题能正确完成,2 道题不能完成;应聘者乙每题正确完成的概率都是 ,且每题正确完成与否互不影响.23(1)分别求甲、乙两人正确完成面试题数的分布列及数学期望;(2)请分析比较甲、乙两人谁面试通过的可能性大?解 (1)设甲正确完成面试的题数为 ,则 的可能取值为 1,2,3.P(1) ;P( 2) ;15 35P(3) .15应聘者甲
23、正确完成题数 的分布列为E()1 2 3 2.15 35 15 1 2 3P 15 35 15设乙正确完成面试的题数为 ,则 的可能取值为 0,1,2,3.P( 0) C ;03(1 23)3 127P( 1)C ;13(23)1 (1 23)2 627P( 2)C ;23(23)2 (1 23) 1227P( 3)C .3(23)3 827应聘者乙正确完成题数 的分布列为 0 1 2 3P 127 627 1227 827E()0 1 2 3 2.127 627 1227 827(或因为 B ,所以 E()3 2)(3,23) 23(2)因为 D()(12) 2 (2 2) 2 (32) 2 ,D( )3 .15 35 15 25 23 13 23所以 D()D().综上所述,从做对题数的数学期望考查,两人水平相当;从做对题数的方差考查,甲较稳定;从至少完成 2 道题的概率考查,甲面试通过的可能性大.