1、专题专题 16 概率与统计综合概率与统计综合 1(2020 届湖南省怀化市高三第一次模拟)为了解某地中小学生的近视形成原因,教育部门委托医疗机构对 该地所有中小学生的视力做了一次普查现该地中小学生人数和普查得到的近视情况分别如图 1 和图 2 所 示 (1)求该地中小学生的平均近视率(保留两位有效数字); (2)为调查中学生用眼卫生习惯,该地用分层抽样的方法从所有初中生和高中生中确定 5 人进行问卷调查, 再从这 5 人中随机选取 2 人继续访谈,则此 2 人全部来自高中年级的概率是多少? 【答案】(1)27.07%;(2) 1 10 P 【解析】 (1)近视率 3200 10%3000 30
2、%2000 50% 100%27.07% 300032002000 ; (2)根据分层抽样的特点,高中取 2 名,初中取 3 名, 记高中两名为,A B,初中 3 名为1,2,3, 则所有等可能结果为( ,),( ,1),( ,2),( ,3),( ,1),( ,2),( ,3),(1,2),(1,3),(2,3)A BAAABBB 共 10 个, 记事件M为“此 2 人全部来自高中年级”有( ,)A B,共 1 个, 1 10 P . 2(2020 届陕西省汉中市高三质检)眼保健操是一种眼睛的保健体操,主要是通过按摩眼部穴位,调整眼及 头部的血液循环,调节肌肉,改善眼的疲劳,达到预防近视等眼
3、部疾病的目的.某学校为了调查推广眼保健 操对改善学生视力的效果,在应届高三的全体 800 名学生中随机抽取了 100 名学生进行视力检查,并得到 如图的频率分布直方图. (1)若直方图中后三组的频数成等差数列,试估计全年级视力在 5.0 以上的人数; (2)为了研究学生的视力与眼保健操是否有关系, 对年级不做眼保健操和坚持做眼保健操的学生进行了调查, 得到下表中数据,根据表中的数据,能否在犯错的概率不超过 0.005 的前提下认为视力与眼保健操有关系? 是否做操 是否近视 不做操 做操 近视 44 32 不近视 6 18 附: 2 2 () ()()()() n adbc K ab cd ac
4、 bd 2 P kk 0.10 0.05 0.025 0.010 0.005 k 2.706 3.841 5.024 6.635 7.879 【答案】(1)144人(2)能在犯错误的概率不超过 0.005 的前提下认为视力与眼保健操有关系 【解析】 (1)由图可知,第一组有 3 人,第二组 7 人,第三组 27 人, 因为后三组的频数成等差数列,共有100(3727)63(人) 所以后三组频数依次为 24,21,18, 所以视力在 5.0 以上的频率为 0.18, 故全年级视力在 5.0 以上的人数约为800 0.18 144人 (2) 2 2 100 (44 1832 6) 50 50 76
5、 24 K , 150 7.8957.879 19 因此能在犯错误的概率不超过 0.005 的前提下认为视力与眼保健操有关系. 3(2020 届四川省泸州市高三二诊)某公司为抓住经济发展的契机,调查了解了近几年广告投入对销售收益 的影响, 在若干销售地区分别投入 4 万元广告费用, 并将各地的销售收益绘制成频率分布直方图(如图所示), 由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从 0 开始计数的. (1)根据频率分布直方图计算图中各小长方形的宽度;并估计该公司分别投入 4 万元广告费用之后,对应地 区销售收益的平均值(以各组的区间中点值代表该组的取值); (2)该公司按照类似的研究
6、方法,测得另外一些数据,并整理得到如表: 广告投入 x(单位:万元) 1 2 3 4 5 销售收益 y(单位:万元) 2 3 2 7 由表中的数据显示,x 与 y 之间存在着线性相关关系,请将(1)的结果填入空白栏,根据表格中数据求出 y 关 于 x 的回归真线方程y bxa ,并估计该公司下一年投入广告费多少万元时,可使得销售收益达到 8 万 元? 参考公式:最小二乘法估计分别为 2 1 1 22 11 () n n ii ii i i n n i i ii xyx ynxy b xxn xy xx ,a xby . 【答案】(1)宽度为:2, 平均值:5(2)空白栏中填 5,1.2.2 0
7、yx ,投入6.5万元 【解析】 (1)设长方形的宽度为 m,由频率分布直方图各小长方形面积总和为 1, 可知(0.08+0.1+0.14+0.12+0.04+0.02)m1,所以 m2. 小组依次是0,2),2,4),4,6),6,8),8,10),10,12), 其中点分别为 1,3,5,7,9.11 对应的频率分别为 0.16,0.20,0.28,0.24,0.08,0.04. 故可估计平均值为 1 0.16+3 0.20+5 028+7 0.24+9 0.08+11 0.045. (2)空白栏中填 5. 由题意可知,x 3,y 3.8, 5 1 ii i x y 69, 5 2 1 i
8、 i x 55, 所以 2 695 3 3.8 555 3 b 1.2,abyx 3.81.2 30.2. 所以关于 x 的回归方程为1.2.2 0yx 取8y ,得到6.5x. 4(2020 届陕西省咸阳市高三第二次模拟)某语文报社为研究学生课外阅读时间与语文考试中的作文分数的 关系,随机调查了本市某中学高三文科班6名学生每周课外阅读时间x(单位:小时)与高三下学期期末考试 中语文作文分数y,数据如下表: i x 1 2 3 4 5 6 i y 38 40 43 45 50 54 (1)根据上述数据,求出高三学生语文作文分数y与该学生每周课外阅读时间x的线性回归方程,并预测某 学生每周课外阅
9、读时间为7小时时其语文作文成绩; (2)从这6人中任选2人,这2人中至少有1人课外阅读时间不低于5小时的概率. 参考公式:y bxa ,其中 11 2 2 2 11 nn iiii ii nn ii ii xxyyx ynxy b xxxnx ,aybx $ 参考数据: 6 1 1001 ii i x y , 6 2 1 91 i i x ,45y 【答案】(1)3.233.8yx;预测某学生每周课外阅读时间为7小时时其语文作文成绩为56.2(2) 3 5 【解析】 (1)根据表中数据,计算3.5x ,45y , 6 1 62 2 2 1 6 1001 6 3.5 45 3.2 91 6 3.
10、5 6 ii i i i x yxy b xx . 45 3.2 3.533.8aybx , y关于x的线性回归方程为:3.233.8yx, 当7x 时,3.2 733.856.2y . 预测某学生每周课外阅读时间为7小时时其语文作文成绩为56.2. (2)设这6人阅读时间依次为1、2、3、4、5、6的同学分别为A、B、C、D、E 、F, 从中任选2人,基本事件是AB、AC、AD、AE、AF、BC、BD、BE、BF、CD、CE、CF、DE、 DF、EF共15种, 其中至少1人课外阅读时间不低于5小时的事件是、AE、AF、BE、BF、CE、CF、DE、DF、EF 共9种, 故所求的概率为 93
11、155 P . 5(2020 届山西省太原市高三模拟)手机运动计步已成为一种时尚,某中学统计了该校教职工一天行走步数 (单位:百步),绘制出如下频率分布直方图: ()求直方图中a的值,并由频率分布直方图估计该校教职工一天步行数的中位数; ()若该校有教职工 175 人,试估计一天行走步数不大于 130 百步的人数; ()在()的条件下该校从行走步数大于 150 百步的 3 组教职工中用分层抽样的方法选取 6 人参加远足活动, 再从 6 人中选取 2 人担任领队,求这两人均来自区间150,(170的概率 【答案】()0.008a,中位数为 125;()98;() 2 5 【解析】 ()由题意得
12、0.002 200.006 20200.012 200.010 20200.002 200.002 201aa , 解得0.008a,设中位数为110 x,则 0.002 200.006 200.008 200.0120.5, x解得15x ,所以中位数为 125. ()由175 (0.002 200.006200.008200.01220)98 , 所以估计一天步行数不大于 130 百步的人数为 98 人. ()在区间150,( 170中有 28 人,在区间(170,190中有 7 人,在区间(190,210中有 7 人,按分层抽样抽取 6 人,则从150,(170抽取 4 人,(170,1
13、90和(190,210中各抽取 1 人,设从150,(170抽取 1234 ,A A A A,从(170,190中抽 B,从(190,210中抽 C,则从 6 人中抽取 2 人的情况有: 12131411232422343344 ,AA AA AA AB AC A A A A A B AC A A A B AC A B AC BC共 15 种情况, 其中满足两人均来自区间150,(170的有 121314232434 ,AA AA AA A A A A A A,共 6 种情况, 所以概率 62 155 P ,所以两人均来自区间150,(170的概率为 2 5 . 6(2020 届江西省九江市高
14、三第二次模拟)BMI 指数(身体质量指数,英文为 BodyMassIndex,简称 BMI)是衡 量人体胖瘦程度的一个标准,BMI=体重(kg)/身高(m)的平方.根据中国肥胖问题工作组标准,当 BMI28 时为 肥胖.某地区随机调查了 1200 名 35 岁以上成人的身体健康状况,其中有 200 名高血压患者,被调查者的频 率分布直方图如下: (1)求被调查者中肥胖人群的 BMI 平均值; (2)填写下面列联表,并判断是否有 99.9%的把握认为 35 岁以上成人患高血压与肥胖有关. 2 P Kk 0.050 0.010 0.001 k 3.841 6.635 10.828 肥胖 不肥胖 合
15、计 高血压 非高血 压 合计 附: 2 2 () ()()()() n adbc K ab cd ac bd ,na b cd 【答案】(1)29.8(2)填表见解析;有 99.9%的把握认为 35 岁以上成人患高血压与肥胖有关 【解析】 (1)根据频率分布直方图, 200 名高血压患者中, BMI 值在28,30的人数为0.1 2 20040 , 在3 0 , 3 2的 人数为0.05 2 20020 ,在32,34的人数为0.025 2 200 10 1000 名非高血压患者中,BMI 值在28,30的人数为0.08 2 1000 160 ,在 30,32的人数为 0.03 2 10006
16、0 ,在 32,34的人数为0.005 2 1000 10 被调查者中肥胖人群的 BMI 平均值 (40 160) 29(2060) 31 (10 10) 33 29.8 4020 10 16060 10 (2)由(1)知,200 名高血压患者中,有40 20 1070人肥胖,200 70 130人不肥胖 1000 名非高血压患者中,有160 60 10230人肥胖,1000 230770人不肥胖 肥胖 不肥胖 合计 高血压 70 130 200 非高血 压 230 770 1000 合计 300 900 1200 2 2 1200 (70 770230 130) 12.810.828 200
17、 1000 900 300 K 有 99.9%的把握认为 35 岁以上成人患高血压与肥胖有关. 7(2020 届湖南省衡阳市高三一模)2020 年 1 月 22 日,国新办发布消息:新型冠状病毒来源于武汉一家海 鲜市场非法销售的野生动.专家通过全基因组比对发现此病毒与 2003 年的非典冠状病毒以及此后的中东呼 吸综合征冠状病毒,分别达到 70%和 40%的序列相似性.这种新型冠状病毒对人们的健康生命带来了严重威 胁因此,某生物疫苗研究所加紧对新型冠状病毒疫苗进行实验,并将某一型号疫苗用在动物小白鼠身上进 行科研和临床实验,得到统计数据如下: 未感染病毒 感染病毒 总计 未注射疫苗 20 x
18、A 注射疫苗 30 y B 总计 50 50 100 现从所有试验小白鼠中任取一只,取到“注射疫苗”小白鼠的概率为 2 5 . (1)求22列联表中的数据x, y,A,B的值; (2)能否有 99.9%把握认为注射此种疫苗对预防新型冠状病毒有效? 附: 2 2 () , ()()()() n adbc Knabcd ab ac cd bd . 2 0 P Kk 0.05 0.01 0.005 0.001 0 k 3.841 6.635 7.879 10.828 【答案】(1)40B ,60A, 40 x, 10y (2)有 99.9%把握认为注射此种疫苗对预防新型冠状病毒有 效 【解析】 (1
19、)由已知条件可知:0.4 10040B ,10060AB,602040 x , 403010y . (2) 2 2 100(20 103040)10050 16.667 50 50604063 K ,显然16.66710.828 所以有 99.9%把握认为注射此种疫苗对预防新型冠状病毒有效. 8(2020 届湖南省常德市高三模拟)某学校为了了解学生对3.12 植树节活动节日的相关内容,学校进行 了一次 10 道题的问卷调查, 从该校学生中随机抽取 50 人, 统计了每人答对的题数, 将统计结果分成0,2), 2,4),4,6),6,8),8,10五组,得到如下频率分布直方图. (1)若答对一题
20、得 10 分,答错和未答不得分,估计这 50 名学生成绩的平均分; (2)若从答对题数在0, 4)内的学生中随机抽取 2 人,求恰有 1 人答对题数在2 , 4)内的概率. 【答案】(1)63.5(2) 8 15 【解析】 (1)答对题数的平均数为(1 0.02 3 0.045 0.1270.2290.10)26.35 , 所以这 50 人的成绩平均分约为10 6.3563.5. (2)答对题数在0,2)内的学生有0.02 2 502 人,记为 ,A B 答对题数在2,4)内的学生有0.04 2 504 人,记为a b c d, , 从答对题数在0,4)内的学生中随机抽取 2 人的情况有( ,
21、)A B,(A,a),(A,b),( , )A c,( , )A d,( ,a)B, ( ,b)B ,( , )B c,( , )B d,( , ) a b,( , )a c,( , )a d ,( , ) b c,( , )b d,( , )c d 共 15 种 其中恰有 1 人答对题数在2,4)内的情况有 8 种 所以恰有 1 人答对题数在2,4)内的概率 8 15 P . 9(2020 届湖北省宜昌市高三调研)目前,新冠病毒引发的肺炎疫情在全球肆虐,为了解新冠肺炎传播途径, 采取有效防控措施,某医院组织专家统计了该地区 500 名患者新冠病毒潜伏期的相关信息,数据经过汇总 整理得到如下图
22、所示的频率分布直方图(用频率作为概率).潜伏期不高于平均数的患者,称为“短潜伏者”,潜 伏期高于平均数的患者,称为“长潜伏者”. (1)求这 500 名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表), 并计算出这 500 名患者中 “长潜伏者”的人数; (2)为研究潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准进行分层抽样,从上述 500 名患者中 抽取 300 人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有 97.5%的把握认为潜伏期长 短与患者年龄有关; 短潜伏者 长潜伏者 合计 60 岁及以上 90 60 岁以下 140 合计 300 (3)研究发现,
23、某药物对新冠病毒有一定的抑制作用,需要在抽取的 300 人中分层选取 7 位 60 岁以下的患 者做期临床试验, 再从选取的 7 人中随机抽取两人做期临床试验, 求两人中恰有 1 人为“长潜伏者”的概率. 附表及公式: 2 0 P Kk 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0 k 2.072 2.706 3.841 5.024 6.635 7.879 10.828 2 2 () ()()()() n adbc K ab cd ac bd 【答案】(1)平均数为6,“长潜伏者”的人数为250人 (2)列联表见解析,有 97.5%的把握认为潜伏期长短与年龄
24、有关 (3) 4 7 P 【解析】 (1)平均数 0.02 1 0.08 3 0.15 50.18 70.03 90.03 11 0.01 1326x . “长潜伏者”即潜伏期时间不低于 6 天的频率为 0.5 所以 500 人中“长潜伏者”的人数为500 0.5250人 (2)由题意补充后的列联表如图: 短潜伏者 长潜伏者 合计 60 岁及以上 90 70 160 60 岁以下 60 80 140 合计 150 150 300 所以 2 k的观测值为 2 300 (90 8060 70)75 5.3575.024 150 150 160 14014 k , 经查表,得 2 5.0240.02
25、5P k ,所以有 97.5%的把握认为潜伏期长短与年龄有关. (3)由分层抽样知 7 人中,“短潜伏者”有 3 人,记为, ,a b c,“长潜伏者”有 4 人,记为 D,E,F,G, 从中抽取 2 人,共有, a b,, a c,, a D,, a E,, a F,, a G,, b c, , b D,, b E,, b F,, b G,, c D,, c E,, c F,, c G,,D E, ,D F,,GD,,E F,,E G,,F G, 共有 21 种不同的结果,两人中恰好有 1 人为“长潜伏者”包含了 12 种结果. 所以所求概率 124 217 P . 10(2020 届湖北省
26、高三模拟)2020 年春节期间,新型冠状病毒(2019nCoV)疫情牵动每一个中国人的心, 危难时刻全国人民众志成城共克时艰,为疫区助力我国 S 省 Q 市共 100 家商家及个人为缓解湖北省抗 疫消毒物资压力,募捐价值百万的物资对口输送湖北省 H 市 (1)现对 100 家商家抽取 5 家, 其中 2 家来自 A 地, 3 家来自 B 地, 从选中的这 5 家中, 选出 3 家进行调研 求 选出 3 家中 1 家来自 A 地,2 家来自 B 地的概率 (2)该市一商家考虑增加先进生产技术投入,该商家欲预测先进生产技术投入为 49 千元的月产增量现用以 往的先进技术投入 xi(千元)与月产增量
27、 yi(千件)(i1,2,3,8)的数据绘制散点图,由散点图的样本点 分布,可以认为样本点集中在曲线yab x的附近,且:46.65636.8xyt, 8 2 1 289.9 i i xx , 8 2 1 1.6 i i tt , 8 1 1469 ii i xxyy , 8 1 108.8 ii i ttyy ,其 中, ii tx, 8 1 1 8 i i tt ,根据所给的统计量,求 y 关于 x 回归方程,并预测先进生产技术投入为 49 千 元时的月产增量 附:对于一组数据(u1,v1)(u2,v2),其回归直线 v+u 的斜率和截距的最小二乘法估计分别为 1 2 1 n ii i n
28、 i i uuvv vu uu , 【答案】(1)0.6;(2)y100.6+68 x,576.6 千件 【解析】 (1)设 A 地 2 家分为 A1,A2,B 地 3 家分为 B1,B2,B3,由题意得,所有情况为: (A1,A2,B1),(A1,A2,B2),(A1,A2,B3),(A1,B1,B2),(A1,B1,B3), (A1,B2,B3),(A2,B1,B2),(A2,B1,B3),(A2,B2,B3),(B1,B2,B3), 共 10 种,其中 A 地 1 家,B 地 2 家的有 6 个,故所求的概率为 6 0.6 10 ; (2)由线性回归方程公式, 8 1 8 2 1 108
29、.8 68 1.6 () ii i i i ttyy b tt , 且 a56368 6.8 100.6ybt , 所以线性回归方程为:y100.6+68 x, 当 x49 时,年销售量 y 的预报值 y100.6+68 7576.6 千件, 故预测先进生产技术投入为 49 千元时的月产增量为 576.6 千件 11(2020 届河南省郑州市高三第二次质量预测)在改革开放 40 年成就展上某地区某农产品近几年的产量统 计表: 年份 2014 2015 2016 2017 2018 2019 年份代码x 1 2 3 4 5 6 年产量(万吨) 6.6 6.7 7 7.1 7.2 7.4 (1)根
30、据表中数据,建立y关于x的线性回归方程 ybxa (2)根据线性回归方程预测 2020 年该地区该农产品的年产量 附:对于一组数据 11 ,x y, 22 ,x y,, nn x y,其回归直线方程 ybxa的斜率和截距的最小二乘 估计分别为 1 2 1 n ii i n i i xxyy b xx , a ybx(参考数据: 6 1 2.8 ii i xxyy ,计算结果保留 到小数点后两位) 【答案】(1) 0.166.44yx ;(2)7.56 万吨 【解析】 (1)由题意可知: 123456 3.5 6 x , 6.66.777.1 7.27.4 7 6 y , 6 2 222222
31、1 ( 2.5)( 1.5)( 0.5)0.51.52.517.5 i i xx , 所以 1 2 1 2.8 0.16 17.5 n ii i n i i xxyy b xx , 又 70.16 3.56.44aybx , 故y关于x的线性回归方程为 0.166.44yx (2)由(1)可得,当年份为 2020 年时,年份代码为7x ,此时 0.16 76.447.56y 所以可预测 2020 年该地区该农产品的年产量约为 7.56 万吨 12 (2020 届广西柳州市高三第一次模拟)目前, 青蒿素作为一线抗疟药品得到大力推广某农科所为了深入研 究海拔因素对青蒿素产量的影响,在山上和山下的试
32、验田中分别种植了100株青蒿进行对比试验.现在从山 上和山下的试验田中各随机选取了4株青蒿作为样本,每株提取的青蒿素产量(单位:克)如下表所示: 编号位置 山上 5.0 3.8 3.6 3.6 山下 3.6 4.4 4.4 3.6 (1)根据样本数据,试估计山下试验田青蒿素的总产量; (2)记山上与山下两块试验田单株青蒿素产量的方差分别为 2 1 S, 2 2 S,根据样本数据,试估计 2 1 S与 2 2 S的大小 关系(只需写出结论); (3)从样本中的山上与山下青蒿中各随机选取1株,记这2株的产量总和为n,求8n的概率. 【答案】(1)400g;(2) 22 12 SS;(3) 3 8
33、. 【解析】 (1)由山下试验田4株青蒿样本青蒿素产量数据,得样本平均数 3.64.44.43.6 4 4 x , 则山下试验田100株青蒿的青蒿素的总产量S估算为:100400gSx; (2)由样本中山上、山下单株青蒿素产量的离散程度知 22 12 SS; (3)记8n为事件A,列表: 由上表可以看出,这2株的产量总和n的所有情况共有16种, 而其中8n的情况共有6种,故: 63 168 P A . 13(2020 届广东省湛江市模拟)我国全面二孩政策已于 2016 年 1 月 1 日起正式实施国家统计局发布的数 据显示,从 2012 年到 2017 年,中国的人口自然增长率变化始终不大,在
34、 5上下波动(如图) 为了了解年龄介于 24 岁至 50 岁之间的适孕夫妻对生育二孩的态度如何,统计部门按年龄分为 9 组,每组 选取 150 对夫妻进行调查统计有生育二孩意愿的夫妻数,得到下表: 年龄区 间 24,26 27,29 30,32 33,35 36,38 39,41 42,44 45,47 48,50 有意愿 数 80 81 87 86 84 83 83 70 66 (1)设每个年龄区间的中间值为x,有意愿数为y,求样本数据的线性回归直线方程,并求该模型的相关系 数r(结果保留两位小数); (2)从24,26,33,35,39,41,45,47,48,50这五个年龄段中各选出一对
35、夫妻(能代表该年龄段超 过半数夫妻的意愿)进一步调研,再从这 5 对夫妻中任选 2 对夫妻求其中恰有一对不愿意生育二孩的夫妻 的概率 (参考数据和公式: 1 22 11 ii i n n n ii ii xxyy r xxyy , 1 2 1 n ii i n i i xxyy b xx , a ybx, 999 111 iiiii iii xxyyx yxy , 9 1 26340 ii i x y ,224640473.96) 【答案】(1)0.56100.72yx -0.63(2) 3 5 【解析】 (1)由题意可求得: 333 37 9 x , 9 1 720 i i y ,80y ,
36、 9 1 26640 i i xy , 9 1 26340 ii i x y , 999 111 2634026640300 iiiii iii xxyyx yxy 又 22 9 2 2 1 22222 1296336912540 i i xx , 9 2 1 0149361699100196416 i i yy , 99 22 11 540416224640 ii ii xxyy 300 0.56 540 b 100.72aybx 回归直线方程为0.56100.72yx 9 1 99 22 11 300300 0.63 473.96224640 i i ii ii i xxyy r xxyy
37、 (2)由题意可知,在24,26,33,35,39,41年龄段中, 超过半数的夫要有生育二孩意愿,在45,47,48,50年龄段中, 超过半数的夫妻没有生育二孩意愿 设从24,26,33,35,39,41年龄段中选出的夫妻分别为 1 A, 2 A, 3 A, 从45,47,48,50年龄段中选出的夫妻分别为 1 B, 2 B 则从中选出 2 对夫妻的所有可能结果为 12 ,A A, 13 ,A A, 11 ,A B, 12 ,A B, 23 ,A A, 21 (,)A B, 22 (,)A B, 31 (,)A B, 32 (,)A B, 12 (,)B B ,共 10 种情况 其中恰有一对不
38、愿意生育二孩的夫妻的情况有 11 ,A B, 12 (,)A B, 21 (,)A B, 22 ,A B, 31 ,A B, 32 ,A B,共 6 种 恰有一对不愿意生育二孩的夫妻的概率 63 105 P 14(2020 届广东省汕头市高三第一次模拟)从某小区抽取 50 户居民进行月用电量调查,发现其用电量都在 50 到 350 度之间,将用电量的数据绘制成频率分布直方图如下. (1)求频率分布直方图中x的值并估计这 50 户用户的平均用电量; (2)若将用电量在区间50,150)内的用户记为A类用户,标记为低用电家庭,用电量在区间250,350)内的 用户记为B类用户,标记为高用电家庭,现
39、对这两类用户进行问卷调查,让其对供电服务进行打分,打分 情况见茎叶图: 从B类用户中任意抽取 3 户,求恰好有 2 户打分超过 85 分的概率; 若打分超过 85 分视为满意, 没超过 85 分视为不满意, 请填写下面列联表, 并根据列联表判断是否有95% 的把握认为“满意度与用电量高低有关”? 满意 不满意 合计 A类用户 B类用户 合计 附表及公式: 2 0 ()P Kk 0.050 0.010 0.001 0 k 3.841 6.635 10.828 2 2 () ()()()() n adbc K ab cd ac bd ,na b cd . 【答案】(1)0.0044x,186(2)
40、 15 28, 没有把握 【解析】 (1) 1 (0.0060.00360.0024 50 x 20.0012)0.0044 , 按用电量从低到高的六组用户数分别为 6,9,15,11,6,3, 所以估计平均用电量为 6 759 125 15 175 11 2256 2753 325 50 186度. (2)B类用户共 9 人,打分超过 85 分的有 6 人,所以从B 类用户中任意抽取 3 户,恰好有 2 户打分超过 85 分的概率为 21 63 3 9 15 28 C C C . 满意 不满意 合计 A类用户 6 9 15 B类用户 6 3 9 合计 12 12 24 因为 2 K 的观测值
41、 2 246 96 3 12 12 9 15 k 1.63.841, 所以没有95%的把握认为“满意与否与用电量高低有关”. 15(2020 届广东省东莞市高三模拟)在党中央的正确领导下,通过全国人民的齐心协力,特别是全体一线医 护人员的奋力救治,二月份“新冠肺炎”疫情得到了控制甲、乙两个地区采取防护措施后,统计了从 2 月 7 日到 2 月 13 日一周的新增“新冠肺炎”确诊人数,绘制成如图折线图: (1)根据图中甲、乙两个地区折线图的信息,写出你认为最重要的两个统计结论; (2)新冠病毒在进入人体后有一段时间的潜伏期,此期间为病毒传播的最佳时期,我们把与病毒感染者有过 密切接触的人群称为密
42、切接触者,假设每位密切接触者不再接触其他病毒感染者,10 天内所有人不知情且 生活照常 (i)在不加任何防护措施的前提下,假设每位密切接触者被感染的概率均为01pp第一天,若某位 感染者产生()a aN名密切接触者则第二天新增感染者平均人数为 ap;第二天,若每位感染者都产生 a 名 密切接触者,则第三天新增感染者平均人数为1apap;以此类推,记由一名感染者引发的病毒传播的 第 n 天新增感染者平均人数为10(2) n En写出 4 E, n E; (ii)在(i)的条件下,若所有人都配戴口罩后,假设每位密切接触者被感染的概率均为 p ,且满足关系 2 ln(1) 3 ppp ,此时,记由一
43、名感染者引发的病毒传播的第 n 天新增感染者平均人数为 (210) n En 当 p 最大,且10a 时,根据 6 E和 6 E的值说明戴口罩的必要性( p 精确到0.1) 参考公式:函数ln 1yx的导函数 1 1 y x ; 参考数据:ln3 1.1,ln20.7, 4 61296 【答案】(1)甲地区比乙地区新增人数的平均数低,甲地区比乙地区的方差大;(2)(i) 2 4 (1)Eapap, 2 (1)n n Eapap ,210n,n N,(ii) 66 EE 说明戴口罩很有必要,详解见解析. 【解析】 (1)甲地区比乙地区新增人数的平均数低,甲地区比乙地区的方差大; (2)(i)由题
44、知第二天后累计感染者人数为1ap,所以第三天新增感染者人数有 3 1Eapap,则累计感 染者人数为 2 111apaapppa ;所以第四天新增感染者人数为 2 4 (1)Eapap,依次类推得 2 (1)n n Eapap ; (ii)令 2 ( )ln(1) 3 f ppp,则 1221 ( ) 133(1) p fp pp , 当 0fp 时, 1 0 2 p, fp单调递增; 当 0fp 时, 1 1 2 p, fp单调递减; 故 max 1311 ( )1ln3ln21.10.70.30.1 2233 f pfn , 所以当0.5p 时, p 取得最大值 0.1, 此时 44 6
45、100.5(1 100.5)5 66480E , 6 (10 0.11 10 0.1 416)E , 66 EE , 戴口罩很有必要 16(2020 届甘肃省兰州市高三诊断)甘肃省是土地荒漠化较为严重的省份,一代代治沙人为了固沙、治沙, 改善生态环境,不断地进行研究与实践,实现了沙退人进.2019年,古浪县八步沙林场“六老汉”三代人治沙 群体作为优秀代表,被中宣部授予“时代楷模”称号.在治沙过程中为检测某种固沙方法的效果,治沙人在某 一实验沙丘的坡顶和坡腰各布设了50个风蚀插钎,以测量风蚀值.(风蚀值是测量固沙效果的指标之一,数 值越小表示该插钎处被风吹走的沙层厚度越小,说明固沙效果越好,数值
46、为0表示该插钎处没有被风蚀)通 过一段时间的观测,治沙人记录了坡顶和坡腰全部插钎测得的风蚀值(所测数据均不为整数),并绘制了相应 的频率分布直方图. ()根据直方图估计“坡腰处一个插钎风蚀值小于30”的概率; ()若一个插钎的风蚀值小于30,则该数据要标记“”,否则不标记根据以上直方图,完成列联表: 标记 不标记 合计 坡腰 坡顶 合计 并判断是否有95%的把握认为数据标记“”与沙丘上插钎所布设的位置有关? 附: 2 2 n adbc K abcdacbd . 2 P Kk 0.050 0.010 0.001 k 3.841 6.635 10.828 【答案】()0.6;()列联表见解析,有9
47、5%的把握认为数据标记“”与沙丘上插钎所布设的位置有关. 【解析】 ()设“坡腰处一个插钎风蚀值小于30”为事件C, 0.8 0.160.360.6P C ; ()完成列联表如下: 标记 不标记 合计 坡腰 30 20 50 坡顶 20 30 50 合计 50 50 100 根据列联表,计算得: 2 2 10030 3020 20 43.841 50 50 50 50 K . 所以有95%的把握认为,数据标记“”与沙丘上插钎所布设的位置有关. 17(2020 届安徽省皖南八校高三第三次联考)2019 新型冠状病译(2019-nCoV)于 2020 年 1 月 12 日被世界卫 生组织命名.冠状病毒是一个大型病毒家族,可引起感冒以及中东呼吸综合征(MERS)和严重急性呼吸综合征 (SARS)等较严重疾病.某医院对病患及家属是否带口罩进行了调查,统计人数得到如下列联表: 戴口罩 未戴口罩 总计 未感染 30 10 40 感染 4 6 10 总计 34 16