1、综合突破六综合突破六 概率与统计综合问题概率与统计综合问题 考点一考点一 统计图表与概率统计图表与概率 (2020届安徽定远中学模拟)资料表明,近几年来,某市雾霾治理取得了很大成效,空气质量与前 几年相比得到了很大改善该市设有 9 个监测站点监测空气质量指数(AQI),其中在轻度污染区、中度污染 区、重度污染区分别设有 2,5,2 个监测站点,以 9 个站点测得的 AQI 的平均值为依据,播报该市的空气 质量 (1)若某日播报该市的 AQI 为 118,已知轻度污染区 AQI 的平均值为 74,中度污染区 AQI 的平均值为 114,求该市重度污染区 AQI 的平均值; (2)下表为 2020
2、 年 11 月的 30 天中该市 AQI 的分布,11 月份仅有一天 AQI 在170,180)内 组数 分组 天数 第一组 50,80) 3 第二组 80,110) 4 第三组 110,140) 4 第四组 140,170) 6 第五组 170,200) 5 第六组 200,230) 4 第七组 230,260) 3 第八组 260,290) 1 ()该市某中学利用每周日的时间进行社会实践活动,以公布的 AQI 为标准,如果 AQI 小于 180, 则去进行社会实践活动,以统计数据中的频率为概率,求该校周日去进行社会实践活动的概率; ()在“创建文明城市”活动中,该市的空气质量作为一个评价指
3、标,从该市当月的空气质量监 测数据中抽取 3 天的数据进行评价,设抽取到的 AQI 不小于 180 的天数为 X,求 X 的分布列及数学期 望 解:(1)设该市重度污染区 AQI 的平均值为 x,则 74211452x1189, 解得 x172 即重度污染区 AQI 的平均值为 172 (2)()由题意知,AQI 在170,180)内的天数为 1, 由题表可知,AQI 在50,170)内的天数为 17,故 11 月份 AQI 小于 180 的天数 为 11718, 又18 30 3 5,则该校周日去进行社会实践活动的概率为 3 5 ()由题意知,X 的所有可能取值为 0,1,2,3,且 P(X
4、0)C 3 18C 0 12 C3 30 204 1 015, P(X1)C 2 18C 1 12 C3 30 459 1 015, P(X2)C 1 18C 2 12 C3 30 297 1 015, P(X3)C 0 18C 3 12 C3 30 11 203 则 X 的分布列为 X 0 1 2 3 P 204 1 015 459 1 015 297 1 015 11 203 数学期望 E(X)0 204 1 0151 459 1 0152 297 1 0153 11 203 6 5 【点拨】 解决此类问题需要“闯三关”,即“文字 关”“图表关”“计算关”重在审图表、明数据,准确提取 信息
5、是关键,然后根据信息一步步实现图表数据与数学符号语 言的转化,建立数学模型解决问题 (2021届湛江二十一中月考)某高校为了解玩手机游戏对个人心理健康的影响,用 随机抽样的形式对在校学生 100 人进行了抽样调查,结果显示被抽查的 100 人中,日均玩游 戏 3 h 以上人数为 20,其中出现心理问题人数为 14,日均玩游戏 3 h 以下的学生中,出现心 理问题的人数是未出现心理问题人数的1 4 (1)经过计算,完成以下 22 列联表 出现心理问题 未出现心理问题 合计 日均玩游戏 3 h 以上 日均玩游戏 3 h 以下 合计 (2)据上表, 判断是否有 999%的把握认为“日均玩游戏 3 h
6、 以上”和“出现心理问题” 有关? (3)以本次调查得到的频率为概率, 在校园里随机调查 3 人, 设日均玩游戏 3 h 以上人数 为 X,求 X 的分布列和数学期望 附:K2 n(adbc)2 (ab)(cd)(ac)(bd), P(K2k) 0050 0010 0001 k 3841 6635 10828 解:(1)在日均玩游戏 3 h 以上 20 人中,出现心理问题 14 人,未出现心理问题人数为 2014 6,日均玩游戏 3 h 以下 80 人,其中出现心理问题人数为 801 516,未出现心理问题人数为 80 1664 补全 22 列联表如下: 出现心理问题 未出现心理问题 合计 日
7、均玩游戏 3 h 以上 14 6 20 日均玩游戏 3 h 以下 16 64 80 合计 30 70 100 (2)K2100(6414166) 2 20803070 190510828 所以有 999%的把握认为“日均玩游戏 3 h 以上”和“出现心理问题”有关 (3)由题意知日均玩游戏 3 h 以上的概率 p 20 10002X 可能的取值为 0,1,2,3, P(X0)C0 3(1p) 30512, P(X1)C1 3p(1p) 20384, P(X2)C2 3p 2(1p)0096, P(X3)C3 3p 30008, 所以 X 的分布列为 X 0 1 2 3 P 0512 0384
8、0096 0008 数学期望 E(X)0051210384200963000806(或由 XB(3,02) 求得 E(X)30206) 考点二考点二 统计图表与正态分布统计图表与正态分布 为加强对企业产品质量的管理,市监局到区机械厂抽查机器零件的质量,共抽取了 600 件螺帽,将它们的直径和螺纹距之比 Z 作为一项质量指标,由测量结果得如下频率分布直 方图 (1)求这 600 件螺帽质量指标值的样本平均数 x , 样本方差 s2(在同一组数据中, 用该区 间的中点值作代表) (2)由频率分布直方图可以近似地认为,这种螺帽的质量指标值 Z 服从正态分布 N(, 2),其中 近似为样本平均数x ,
9、 2 近似为样本方差 s2 ()利用该正态分布,求 P(18503Z22994); ()现从该企业购买了 100 件这种螺帽,记 X 表示这 100 件螺帽中质量指标值位于区 间(18503,22994)的件数,利用()的结果,求 E(X) 附: 2241497 若 ZN(, 2),则 P(Z)06827,P(2Z2)09545 解:(1)抽取的螺帽质量指标值的样本平均数x和样本方差 s2分别为: x170005180012190018200030210019220010 230006200, s2(30)2005(20)2012(10)20180030102019202 0103020062
10、24 (2)()由(1)知,ZN(200,224),从而 P(2001497Z2001497)2P(18503Z200)06827, P(2002994Z2002994)2P(200Z22994)09545, 所以 P(18503Z22994)P(185032391 百元, 所以 A 家庭不属于“收入较低家庭” (2)()将样本的频率视为概率, 抽取一户家庭某月收入低于 8 000 元的概率为(0002 001500150020028)1008, 随机抽取 n 户家庭月收入均低于 8 000 元的概率为 08n05,n3,则 n 的最大 值为 3 ()由(1)知 671 百元6710 元,故
11、A 家庭月收入低于 ,可获赠两次购物卡,设所 获得的金额为随机变量 Y,则 Y 的取值分别为 200,300,400,500,600, P(Y200)1 2 1 2 1 4, P(Y300)21 2 1 3 1 3, P(Y400)21 2 1 6 1 3 1 3 5 18, P(Y500)21 3 1 6 1 9, P(Y600)1 6 1 6 1 36 则 A 家庭预期获得的购物卡金额为 E(Y)1 4200 1 3300 5 18400 1 9500 1 36600333 元 考点三考点三 概率与函数、数列等的综概率与函数、数列等的综合合 为响应绿色出行,某市在推出共享单车后,又推出新能
12、源分时租赁汽车其中一款新能源分 时租赁汽车,每次租车收费的标准由两部分组成:根据行驶里程数按 1 元/km 计费;行驶时间不 超过 40 min 时按 012 元/min 计费,超过 40 min 时,超出部分按 020 元/min 计费已知张先生家 离上班地点 15 km,每天租用该款汽车上、下班各一次由于堵车、红绿灯等因素,每次路上开车花 费的时间 t(单位:min)是一个随机变量现统计了张先生 50 次路上开车花费的时间,在各时间段内的 频数分布情况如下表所示 时间 t/min (20,30 (30,40 (40,50 (50,60 频数 2 18 20 10 将频率视为概率,每次路上开
13、车花费的时间视为用车时间 (1)写出张先生一次租车费用 y(单位:元)与用车时间 t(单位:min)的函数关系式; (2)若张先生一次开车时间不超过 40 min 为“路段畅通”, 设 表示 3 次租用新能源 分时租赁汽车中“路段畅通”的次数,求 的分布列和期望; (3)若公司每月给 1 000 元的交通补助,请估计张先生每月(按 22 天计算)的交通补助 是否足够让张先生上、下班租用新能源分时租赁汽车?并说明理由(同一时段的时间用 该区间的中点值代表) 解:(1)当 20t40 时,y012t15; 当 40t60 时, y01240020(t40)1502t118 所以 y 012t15,
14、20t40, 02t118,40t60 (2)张先生租用一次新能源分时租赁汽车中“路段畅通”的概率 p218 50 2 5, 可能的取值为 0,1,2,3 P(0)C0 3 2 5 0 3 5 3 27 125, P(1)C1 3 2 5 1 3 5 2 54 125, P(2)C2 3 2 5 2 3 5 1 36 125, P(3)C3 3 2 5 3 3 5 0 8 125, 的分布列为 0 1 2 3 P 27 125 54 125 36 125 8 125 E()0 27 1251 54 1252 36 1253 8 12512 另解:易知 B 3,2 5 ,所以 E()32 512
15、 (3)张先生每月的交通补助足够让他上、下班租用新能源分时租赁汽车理由如下 方法一:张先生租用一次新能源分时租赁汽车的平均用车时间 t25 2 5035 18 5045 20 50 5510 50426(min), 每次租用新能源分时租赁汽车的平均费用为 024261182032(元), 张先生一个月上、下班租车费用约为 203222289408(元),因为 894081 000, 故张先生每月的交通补助足够让他上、下班租用新能源分时租赁汽车 方法二:张先生租用一次新能源分时租赁汽车的平均租车费用为(15 01225) 2 50(150 1235)18 50(11 80245)20 50(11
16、 80255)10 50 20512(元), 张先生一个月上、下班租车费用约为 20512222902528(元), 因为 9025281 000, 故张先生每月的交通补助足够让他上、下班租用新能源分时租赁汽车 【点拨】 随着高考数学试卷综合性的提升,概率与函数、数列等的 综合问题有强化的趋势函数方面,关注分段函数、多项式函数等函数 模型;数列方面,关注递推数列模型 (2019珠海高三摸底)某芯片代工厂生产某型号芯片每盒 12 片,每批生产若干盒,每 片成本 1 元,每盒芯片需检验合格后方可出厂,检验方案是从每盒芯片随机取 3 片检验,若发 现次品, 就要把全盒 12 片芯片全部检验, 然后用
17、合格品替换掉不合格品, 方可出厂; 若无次品, 则认定该盒芯片合格,不再检验,可出厂 (1)若某盒芯片中有 9 片合格,3 片不合格,求该盒芯片经一次检验即可出厂的概率? (2)若每片芯片售价 10 元,每片芯片检验费用 1 元,次品到达组装工厂被发现后,每片须 由代工厂退赔 10 元,并补偿 1 片经检验合格的芯片给组装厂设每片芯片不合格的概率为 p(0 p1),且相互独立 ()若某盒 12 片芯片中恰有 3 片次品的概率为 f(p),求 f(p)的最大值点 p0; ()若以()中的 p0作为 p 的值,由于质检员操作疏忽,有一盒芯片未经检验就被贴上合 格标签出厂到组装工厂,试确定这盒芯片最
18、终利润 X(单位:元)的期望 解:(1)设“该盒芯片经一次检验即可出厂”的事件为 A, 则 P(A) C3 9 C3 12 21 55 故该盒芯片经一次检验即可出厂的概率为21 55 (2)()某盒 12 片芯片中恰有 3 片次品的概率 f(p)C3 12p 3(1p)9,求导得 f(p)C3 123p 2(1p)99C3 12p 3(1p)83C3 12p 2(1p)8(1 4p)因为在(0,1 4)上 f(p)0;在( 1 4,1)上 f(p)0,所以当 p 1 4时,f(p)最大,即 p0 1 4 另外,也可由 f(p) 1 27C 3 12 3p3p3p(1p)9 12 12 1 27
19、C 3 12 3 4 12 ,当且仅当 3p1p, 即 p1 4时取等号 故 f(p)的最大值点 p01 4 ()由题设知,pp01 4, 设这盒芯片不合格品个数为 n, 则 nB 12,1 4 , 故 E(n)121 43, 则 E(X)12012303272, 所以这盒芯片最终利润 X 的期望是 72 元 考点四考点四 开放型决策问题开放型决策问题 (2018 全国卷)下图是某地区 2000 年至 2016 年环境基础设施投资额 y(单位:亿元)的折线图 为了预测该地区 2018 年的环境基础设施投资额, 建立了 y 与时间变量 t 的两个线性回归模型 根据 2000 年至 2016 年的
20、数据(时间变量 t 的值依次为 1,2,17)建立模型:y 30.413.5t;根据 2010 年至 2016 年的数据(时间变 量 t 的值依次为 1,2,7)建立模型:y 9917.5t. (1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由 解: 利用模型, 该地区 2018 年的环境基础设施投资额的预测值为y 30.413.519226.1(亿元) 利用模型,该地区 2018 年的环境基础设施投资额的预测值为y 9917.59256.5(亿元) (2)利用模型得到的预测值更可靠 理由如下: ()从折线图可以
21、看出, 2000 年至 2016 年的数据对应的点没有随机散布在直线 y30.413.5t 上下, 这说明利用 2000 年至 2016 年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋 势.2010 年相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2016 年的数据对应的点位于一条直 线的附近,这说明从 2010 年开始环境基础设施投资额的变化规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模型y 9917.5t 可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势, 因 此利用模型得到的预测值更可靠 ()从计算结果看,相对于
22、 2016 年的环境基础设施投资额 220 亿元,由模型得到的预测值 226.1 亿 元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠 以上给出了两种理由,写出其中任意一种或其他合理理由均可 【点拨】 环保基础设施投资额的增长(并呈加快趋势),体现的是国家重视环 境保护,国人环保意识的增强随着我国提出到 2060 年实现碳中和这一宏伟目标, 高考以环保为核心价值进行命题的可能性会进一步提高统计的重要目标在于给 出统计结论,为决策者提供决策依据, “大数据时代”,高考对统计的考查呈强化趋 势开放型决策问题拿满分的关键在于“言之有理”,这个“理”要结合题意及
23、解答过程中的推理计算,可以是常见的均值、方差,也可以是其他数字特征,抑或 是回归直线中的相关指数 R2(残差)、独立性检验中的临界概率等统计量,还可以是 概率等等 (2020江西高二月考)某学校需要从甲、乙两名学生中选一人参加数学竞赛,抽取了近期 两人 5 次数学考试的成绩,统计结果如下表: 第一 次 第二 次 第三 次 第四 次 第五 次 甲的成绩 (分) 80 85 71 92 87 乙的成绩 (分) 90 76 75 92 82 (1)若从甲、乙两人中选出一人参加数学竞赛,你认为选谁合适?请说明理由 (2)若数学竞赛分初赛和复赛,在初赛中有两种答题方案: 方案一:每人从 5 道备选题中任
24、意抽出 1 道,若答对,则可参加复赛,否则被淘汰 方案二:每人从 5 道备选题中任意抽出 3 道,若至少答对其中 2 道,则可参加复赛,否则被淘 汰 已知学生甲、乙都只会 5 道备选题中的 3 道,那么你推荐的选手选择哪种答题方案进入复赛的 可能性更大?并说明理由 解:(1)解法一: 甲的平均成绩为 1 x8085719287 5 83; 乙的平均成绩为 2 x9076759282 5 83 甲的成绩方差 s2 11 5 i1 5 (xix)2508; 乙的成绩方差为 s2 21 5 i1 5 (xix)2488 由于 1 x 2 x,s2 1s 2 2,乙的成绩较稳定,派乙参赛比较合适,故选
25、乙合适 解法二:派甲参赛比较合适,理由如下: 从统计的角度看,甲获得 85 以上(含 85 分)的概率 P13 5,乙获得 85 分以上(含 85 分)的概率 P2 2 5, 因为 P1P2,故派甲参赛比较合适 (2)若推荐乙5 道备选题中学生乙会的 3 道分别记为 a,b,c,不会的 2 道分别记为 E,F 方案一:学生乙从 5 道备选题中任意抽出 1 道的结果有:a,b,c,E,F 共 5 种,抽中会的备选 题的结果有 a,b,c,共 3 种 所以学生乙可参加复赛的概率 P13 5 方案二:学生乙从 5 道备选题中任意抽出 3 道的结果有 C3 510 种, 抽中至少 2 道会的备选题的结果有 C2 3C 1 2C 3 37 种 所以学生乙可参加复赛的概率 P2 7 10, 因为 P1P2,所以学生乙选方案二进入复赛的可能性更大 若推荐甲,同理选方案二进入复赛的可能性更大