1、8.5统计案例题组一 独立性检验 1(2022雅安模拟)为考察一种新药预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的列联表中,由列联表中的数据计算得.参照附表,下列结论正确的是()附表:0.0500.0250.0100.0050.0013.8415.026.6357.87910.828A在犯错误的概率不超过0.1的前提下,认为“药物有效”B在犯错误的概率不超过0.1的前提下,认为“药物无效”C有99以上的把握认为“药物有效”D有99以上的把握认为“药物无效”2(2022成都模拟)在某大学一食品超市,随机询问了70名不同性别的大学生在购买食物时是否查看营养说明,得到如
2、下的列联表:女男总计要查看营养说明152540不查看营养说明201030总计353570附:,其中0.500.400.250.150.100.050.0250.0100.0050.4550.7081.3232.0722.7063.8415.0246.6357.879根据列联表的独立性检验,则下列说法正确的是()A在犯错误的概率不超过0.05的前提下认为该校大学生在购买食物时要查看营养说明的人数中男生人数更多B在犯错误的概率不超过0.010的前提下认为该校女大学生在购买食物时要查看营养说明的人数与不查看营养说明的人数比为C在犯错误的概率不超过0.025的前提下认为性别与是否查看营养说明有关系D在
3、犯错误的概率不超过0.010的前提下认为性别与是否查看营养说明有关系3(2022武昌模拟)通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:跳绳性别合计男女爱好402060不爱好203050合计6050110已知,0.050.010.0013.8416.63510.828则以下结论正确的是()A根据小概率值的独立性检验,爱好跳绳与性别无关B根据小概率值的独立性检验,爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001C根据小概率值的独立性检验,有99%以上的把握认为“爱好跳绳与性别无关”D根据小概率值的独立性检验,在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别无关”4(
4、2022广东佛山模拟预测)武汉热干面既是中国四大名面之一,也是湖北武汉最出名的小吃之一某热干面店铺连续10天的销售情况如下(单位:份):天数12345678910套餐一12010014014012070150120110130套餐二809090605090708090100(1)分别求套餐一、套餐二的均值、方差,并判断两种套餐销售的稳定情况;(2)假定在连续10天中每位顾客只购买了一份,根据图表内容填写下列列联表,并据此判断能否有95%的把握认定顾客性别与套餐选择有关?顾客套餐套餐一套餐二合计男顾客400女顾客500合计附:0.100.050.0250.0102.7063.8415.0246.
5、635题组二 线性回归方程1(2022永州三模)某新能源汽车销售公司统计了某款汽车行驶里程(单位:万千米)对应维修保养费用(单位:万元)的四组数据,这四组数据如下表:行驶里程/万千米1245维修保养费用/万元0.500.902.302.70若用最小二乘法求得回归直线方程为,则估计该款汽车行驶里程为6万千米时的维修保养费是()A3.34万元B3.62万元C3.82万元D4.02万元2(2022东北模拟)为研究变量x,y的相关关系,收集得到下面五个样本点(x,y):x99.51010.511y1110865若由最小二乘法求得y关于x的回归直线方程为,则据此计算残差为0的样本点是()A(9,11)B
6、(10,8)C(10.5,6)D(11.5)3(2022平江模拟)(多选)下列说法正确的是() A线性回归方程 必过 B设具有线性相关关系的两个变量x,y的相关系数为r,则 越接近于0,x和y之间的线性相关程度越强C在一个 列联表中,由计算得 的值,则 的值越小,判断两个变量有关的把握越大D若 , ,则 4自2020年初,新型冠状病毒引起的肺炎疫情爆发以来,各地医疗机构采取了各种有针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示,由表格可得y关于x的二次回归方程为,则下列说法正确的是() 周数(x)12345治愈人数(y)2173693142ABC此
7、回归模型第4周的残差(实际值与预报值之差)为5D估计第6周治愈人数为2205(2022武汉模拟)(多选)在研究某种产品的零售价(单位:元)与销售量(单位:万件)之间的关系时,根据所得数据得到如下所示的对应表:12141618201716141311利用最小二乘法计算数据,得到的回归直线方程为,则下列说法中正确的是()A与的样本相关系数B回归直线必过点CD若该产品的零售价定为22元,可预测销售量是9.7万件6(2022德州二模)2021年12月17日,工信部发布的“十四五“促进中小企业发展规划明确提出建立”百十万千”的中小企业梯度培育体系,引导中小企业走向“专精特新”、“小巨人”、“隐形冠军”的
8、发展方向,“专精特新”是指具备专业化、精细化、特色化,新颖化优势的中小企业下表是某地各年新增企业数量的有关数据:年份(年)20172018201920202021年份代码(x)12345新增企业数量:(y)817292442参考公式:回归方程 中,斜率和截距最小二乘法估计公式分别为 , (1)请根据上表所给的数据,求出y关于x的线性回归方程,并预测2023年此地新增企业的数量;(2)若在此地进行考察,考察企业中有4个为“专精特新”企业,3个为普通企业,现从这7个企业中随机抽取3个,用X表示抽取的3个为“专精特新”全业个数,求随机变量X的分布列与期望7(2022烟台模拟)当下,大量的青少年沉迷于
9、各种网络游戏,极大地毒害了青少年的身心健康.为了引导青少年抵制不良游戏,适度参与益脑游戏,某游戏公司开发了一款益脑游戏,在内测时收集了玩家对每一关的平均过关时间,如下表:关卡123456平均过关时间(单位:秒)5078124121137352计算得到一些统计量的值为:,其中,.参考公式:对于一组数据(),其经验回归直线的斜率和截距的最小二乘估计分别为,.(1)若用模型拟合与的关系,根据提供的数据,求出与的经验回归方程;(2)制定游戏规则如下:玩家在每关的平均过关时间内通过可获得积分2分并进入下一关,否则获得分且该轮游戏结束.甲通过练习,前3关都能在平均时间内过关,后面3关能在平均时间内通过的概
10、率均为,若甲玩一轮此款益脑游戏,求“甲获得的积分”的分布列和数学期望.8(2022安阳模拟)为有效防控疫情,于2021年9月开始,多省份相继启动新冠疫苗加强免疫接种工作.新冠疫苗接种一段时间后,有保护效果削弱的情况存在,加强针的接种则会使这种下降出现“强势反弹”.研究结果显示,接种加强针以后,受种者的抗体水平将大幅提升,加强免疫14天后,抗体水平相当于原来10-30倍,6个月后,能维持在较高水平,并且对德尔塔等变异株出现良好交叉中和作用.某市开展加强免疫接种工作以来,在某一周的接种人数(单位:万人)如下表所示:星期一星期二星期三星期四星期五星期六星期日接种人数1.71.92.12.32.42.
11、5a规定星期一为第1天,设天数为,当日接种人数为y.参考公式:,.(1)若当日接种人数超过1.8万人,则认为“接种繁忙”,从前4天中随机选择2天,求这2天接种繁忙的概率;(2)若y关于具有线性相关关系,求y关于x的线性回归方程;(3)根据所求的线性回归方程分别计算星期五,星期六的预报值,并与当日接种人数的真实值y进行比较.若满足,则可用此回归方程预测以后的接种人数,并预测星期日的接种人数a;若不满足,请说明理由.9(2022安阳模拟)共享汽车,是指许多人合用一辆车,即开车人对车辆只有使用权,而没有所有权,有点类似于在租车行业里的短时间的租车它手续简便,打个电话或通过网上就可以预约订车某市为了了
12、解不同年龄的人对共享汽车的使用体验,随机选取了100名使用共享汽车的体验者,让他们根据体验效果进行评分附:回归直线 的斜率 相关系数 独立性检验中的 ,其中 临界值表:0.0500.0100.0013.8416.63510.828(1)设消费者的年龄为x,对共享汽车的体验评分为y若根据统计数据,用最小二乘法得到y关于x的线性回归方程为 ,且年龄x的方差为 ,评分y的方差为 求y与x的相关系数r,并据此判断对共享汽车使用体验的评分与年龄的相关性强弱(当 时,认为相关性强,否则认为相关性弱) (2)现将100名消费者的年龄划分为“青年”和“中老年”,评分划分为“好评”和“差评”,整理得到如下数据,
13、请将 列联表补充完整并判断是否有99.9%的把握认为对共享汽车的评价与年龄有关 好评差评合计青年16 中老年 12 合计 44100题组三 非线性回归方程1(2022广东铁一中学高三期末)年月底,为严防新型冠状病毒疫情扩散,有效切断病毒传播途径,坚决遏制疫情蔓延势头,确保人民群众生命安全和身体健康,多地相继做出了封城决定.某地在月日至日累计确诊人数如下表:日期(月)日日日日日日日人数(人)由上述表格得到如散点图(月日为封城第一天).(1)根据散点图判断与(,均为大于的常数)哪一个适宜作为累计确诊人数与封城后的天数的回归方程类型(给出判断即可,不必说明理由);并根据上表中的数据求出回归方程;(2
14、)随着更多的医护人员投入疫情的研究,月日武汉影像科医生提出存在大量核酸检测呈阴性(阳性则确诊),但观其肺片具有明显病变,这一提议引起了广泛的关注,月日武汉疾控中心接收了份血液样本,假设每份样本的检验结果是阳性还是阴性都是相互独立的,且每份样本是阳性样本的概率为,核酸试剂能把阳性样本检测出阳性结果的概率是(核酸检测存在阳性样本检测不出来的情况,但不会把阴性检测呈阳性),求这份样本中检测呈阳性的份数的期望.参考数据:其中,参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.2(2022山西二模(理)数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表
15、为20172021年中国在线直播用户规模(单位:亿人),其中2017年2021年对应的代码依次为15年份代码x12345市场规模y3.984.565.045.866.36(1)由上表数据可知,可用函数模型拟合y与x的关系,请建立y关于x的回归方程(,的值精确到0.01);(2)已知中国在线直播购物用户选择在品牌官方直播间购物的概率为p,现从中国在线直播购物用户中随机抽取4人,记这4人中选择在品牌官方直播间购物的人数为X,若,求X的分布列与期望参考数据:,其中参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,3(2022贵州模拟预测(理)某企业为加强科研创新,加大研发资金的
16、投入,新研发了一种产品.该产品的生产成本由直接生产成本(如原料工人工资机器设备折旧等)和间接生产成本(如物料消耗管理人员工资车间房屋折旧等)组成.该产品的间接生产成本y(万元)与该产品的生产数量x(千件)有关,经统计并对数据作初步处理,得到散点图及一些统计量的值.3.513.241.8117.51.4619.95.84表中,.(1)根据散点图判断与哪一个更适合作为间接生产成本y与该产品的生产数量x的回归方程类型;(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测生产9千件产品时,间接生产成本是多少万元;(3)为确保产品质量,该企业在生产过程中对生
17、产的每件产品均进行五个环节的质量检测,若检测出不合格产品,则需在未进入下一环节前立即修复(修复后再进入下一环节),已知每个环节是相互独立的,且每个环节产品检测的合格率均为98%,各环节中不合格的一件产品所需的修复费用均为100元,求一件产品需修复的平均费用.附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,.4(2022广东铁一中学高三期末)年月底,为严防新型冠状病毒疫情扩散,有效切断病毒传播途径,坚决遏制疫情蔓延势头,确保人民群众生命安全和身体健康,多地相继做出了封城决定.某地在月日至日累计确诊人数如下表:日期(月)日日日日日日日人数(人)由上述表格得到如散点图(月日为封城第一天
18、).(1)根据散点图判断与(,均为大于的常数)哪一个适宜作为累计确诊人数与封城后的天数的回归方程类型(给出判断即可,不必说明理由);并根据上表中的数据求出回归方程;(2)随着更多的医护人员投入疫情的研究,月日武汉影像科医生提出存在大量核酸检测呈阴性(阳性则确诊),但观其肺片具有明显病变,这一提议引起了广泛的关注,月日武汉疾控中心接收了份血液样本,假设每份样本的检验结果是阳性还是阴性都是相互独立的,且每份样本是阳性样本的概率为,核酸试剂能把阳性样本检测出阳性结果的概率是(核酸检测存在阳性样本检测不出来的情况,但不会把阴性检测呈阳性),求这份样本中检测呈阳性的份数的期望.参考数据:其中,参考公式:
19、对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.5(2022山西二模(理)数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表为20172021年中国在线直播用户规模(单位:亿人),其中2017年2021年对应的代码依次为15年份代码x12345市场规模y3.984.565.045.866.36(1)由上表数据可知,可用函数模型拟合y与x的关系,请建立y关于x的回归方程(,的值精确到0.01);(2)已知中国在线直播购物用户选择在品牌官方直播间购物的概率为p,现从中国在线直播购物用户中随机抽取4人,记这4人中选择在品牌官方直播间购物的人数为X,若,求X
20、的分布列与期望参考数据:,其中参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,8.5 统计案例题组一 独立性检验 1(2022雅安模拟)为考察一种新药预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的列联表中,由列联表中的数据计算得.参照附表,下列结论正确的是()附表:0.0500.0250.0100.0050.0013.8415.026.6357.87910.828A在犯错误的概率不超过0.1的前提下,认为“药物有效”B在犯错误的概率不超过0.1的前提下,认为“药物无效”C有99以上的把握认为“药物有效”D有99以上的把握认为“药物无效”【答案
21、】C【解析】因为,即,所以有99%以上的把握认为“药物有效”故答案为:C2(2022成都模拟)在某大学一食品超市,随机询问了70名不同性别的大学生在购买食物时是否查看营养说明,得到如下的列联表:女男总计要查看营养说明152540不查看营养说明201030总计353570附:,其中0.500.400.250.150.100.050.0250.0100.0050.4550.7081.3232.0722.7063.8415.0246.6357.879根据列联表的独立性检验,则下列说法正确的是()A在犯错误的概率不超过0.05的前提下认为该校大学生在购买食物时要查看营养说明的人数中男生人数更多B在犯错
22、误的概率不超过0.010的前提下认为该校女大学生在购买食物时要查看营养说明的人数与不查看营养说明的人数比为C在犯错误的概率不超过0.025的前提下认为性别与是否查看营养说明有关系D在犯错误的概率不超过0.010的前提下认为性别与是否查看营养说明有关系【答案】C【解析】由题可得,在犯错误的概率不超过0.025的前提下认为性别与是否查看营养说明有关系. 故答案为:C.3(2022武昌模拟)通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:跳绳性别合计男女爱好402060不爱好203050合计6050110已知,0.050.010.0013.8416.63510.828则以下结论正确的是
23、()A根据小概率值的独立性检验,爱好跳绳与性别无关B根据小概率值的独立性检验,爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001C根据小概率值的独立性检验,有99%以上的把握认为“爱好跳绳与性别无关”D根据小概率值的独立性检验,在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别无关”【答案】A【解析】由题知因为,所以爱好跳绳与性别无关且这个结论犯错误的概率超过0.001,A符合题意,B不符合题意,又因为,所以有99%以上的把握认为“爱好跳绳与性别有关,或在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别有关.C和D不符合题意.故答案为:A.4(2022广东佛山模拟预测)武汉热干面
24、既是中国四大名面之一,也是湖北武汉最出名的小吃之一某热干面店铺连续10天的销售情况如下(单位:份):天数12345678910套餐一12010014014012070150120110130套餐二809090605090708090100(1)分别求套餐一、套餐二的均值、方差,并判断两种套餐销售的稳定情况;(2)假定在连续10天中每位顾客只购买了一份,根据图表内容填写下列列联表,并据此判断能否有95%的把握认定顾客性别与套餐选择有关?顾客套餐套餐一套餐二合计男顾客400女顾客500合计附:0.100.050.0250.0102.7063.8415.0246.635【答案】(1)套餐一:均值12
25、0,方差480;套餐二:均值80,方差220;套餐二销量相对稳定(2)填表见解析;没有【解析】(1)套餐一:均值方差;套餐二:均值方差因为,所以,套餐二销量相对稳定(2)列联表如下:顾客套餐套餐一套餐二合计男顾客400300700女顾客8005001300合计12008002000因为,所以,没有95%以上的把握认定顾客性别与套餐选有关题组二 线性回归方程1(2022永州三模)某新能源汽车销售公司统计了某款汽车行驶里程(单位:万千米)对应维修保养费用(单位:万元)的四组数据,这四组数据如下表:行驶里程/万千米1245维修保养费用/万元0.500.902.302.70若用最小二乘法求得回归直线方
26、程为,则估计该款汽车行驶里程为6万千米时的维修保养费是()A3.34万元B3.62万元C3.82万元D4.02万元【答案】A【解析】由已知, 所以,即,时,故答案为:A2(2022东北模拟)为研究变量x,y的相关关系,收集得到下面五个样本点(x,y):x99.51010.511y1110865若由最小二乘法求得y关于x的回归直线方程为,则据此计算残差为0的样本点是()A(9,11)B(10,8)C(10.5,6)D(11.5)【答案】B【解析】由题意可知,所以线性方程的样本中心点为,因此有,所以,在收集的5个样本点中,一点在上,故计算残差为0的样本点是.故答案为:B3(2022平江模拟)(多选
27、)下列说法正确的是() A线性回归方程 必过 B设具有线性相关关系的两个变量x,y的相关系数为r,则 越接近于0,x和y之间的线性相关程度越强C在一个 列联表中,由计算得 的值,则 的值越小,判断两个变量有关的把握越大D若 , ,则 【答案】A,D【解析】因为线性回归方程 必过样本中心点 ,所以A符合题意; 因为 越接近于0,x和y之间的线性相关程度越弱,所以B不正确;因为 的值越小,确定两个变量有关的把握的程度越小,所以C不正确;因为 ,所以 ,因此D符合题意。故答案为:AD4自2020年初,新型冠状病毒引起的肺炎疫情爆发以来,各地医疗机构采取了各种有针对性的治疗方法,取得了不错的成效,某地
28、开始使用中西医结合方法后,每周治愈的患者人数如表所示,由表格可得y关于x的二次回归方程为,则下列说法正确的是() 周数(x)12345治愈人数(y)2173693142ABC此回归模型第4周的残差(实际值与预报值之差)为5D估计第6周治愈人数为220【答案】B,C【解析】设 ,则 , 由已知得 ,所以 ,故选项A错,选项B对;在 中,令 ,得 ,所以此回归模型第4周的残差为 .故选项C正确;在 中,令 ,得 ,故选项D错误.故答案为:BC.5(2022武汉模拟)(多选)在研究某种产品的零售价(单位:元)与销售量(单位:万件)之间的关系时,根据所得数据得到如下所示的对应表:12141618201
29、716141311利用最小二乘法计算数据,得到的回归直线方程为,则下列说法中正确的是()A与的样本相关系数B回归直线必过点CD若该产品的零售价定为22元,可预测销售量是9.7万件【答案】B,C,D【解析】由表中数据可知,对于A,根据相关性系数的公式为,故相关系数的正负取决分子A不正确;对于B,C,由变量与的均值,得样本点的中心为,所以样本点的中心必过线性回归方程,B符合题意;将代入中,得,解得,所以,C符合题意;因为,所以回归直线方程为,当时,所以该产品的零售价定为22元,可预测销售量是万件,D符合题意.故答案为:BCD.6(2022德州二模)2021年12月17日,工信部发布的“十四五“促进
30、中小企业发展规划明确提出建立”百十万千”的中小企业梯度培育体系,引导中小企业走向“专精特新”、“小巨人”、“隐形冠军”的发展方向,“专精特新”是指具备专业化、精细化、特色化,新颖化优势的中小企业下表是某地各年新增企业数量的有关数据:年份(年)20172018201920202021年份代码(x)12345新增企业数量:(y)817292442参考公式:回归方程 中,斜率和截距最小二乘法估计公式分别为 , (1)请根据上表所给的数据,求出y关于x的线性回归方程,并预测2023年此地新增企业的数量;(2)若在此地进行考察,考察企业中有4个为“专精特新”企业,3个为普通企业,现从这7个企业中随机抽取
31、3个,用X表示抽取的3个为“专精特新”全业个数,求随机变量X的分布列与期望【答案】见解析【解析】解: , , , ,所以 , ,所以 2023年,即当 时,由线性回归方程可得 ,所以估计2023年此地新增企业的数量的为54家(2)解:由题意可知,X的可能取值为0,1,2,3, 因为 , , , ,所以X的分布列为X0123P所以 7(2022烟台模拟)当下,大量的青少年沉迷于各种网络游戏,极大地毒害了青少年的身心健康.为了引导青少年抵制不良游戏,适度参与益脑游戏,某游戏公司开发了一款益脑游戏,在内测时收集了玩家对每一关的平均过关时间,如下表:关卡123456平均过关时间(单位:秒)507812
32、4121137352计算得到一些统计量的值为:,其中,.参考公式:对于一组数据(),其经验回归直线的斜率和截距的最小二乘估计分别为,.(1)若用模型拟合与的关系,根据提供的数据,求出与的经验回归方程;(2)制定游戏规则如下:玩家在每关的平均过关时间内通过可获得积分2分并进入下一关,否则获得分且该轮游戏结束.甲通过练习,前3关都能在平均时间内过关,后面3关能在平均时间内通过的概率均为,若甲玩一轮此款益脑游戏,求“甲获得的积分”的分布列和数学期望.【答案】见解析【解析】(1)解:因为两边取对数可得,即,令,所以,由,.所以,又,即,所以,所以.所以关于的经验回归方程为(2)解:由题知,甲获得的积分
33、的所有可能取值为5,7,9,12,所以,所以的分布列为57912所以8(2022安阳模拟)为有效防控疫情,于2021年9月开始,多省份相继启动新冠疫苗加强免疫接种工作.新冠疫苗接种一段时间后,有保护效果削弱的情况存在,加强针的接种则会使这种下降出现“强势反弹”.研究结果显示,接种加强针以后,受种者的抗体水平将大幅提升,加强免疫14天后,抗体水平相当于原来10-30倍,6个月后,能维持在较高水平,并且对德尔塔等变异株出现良好交叉中和作用.某市开展加强免疫接种工作以来,在某一周的接种人数(单位:万人)如下表所示:星期一星期二星期三星期四星期五星期六星期日接种人数1.71.92.12.32.42.5
34、a规定星期一为第1天,设天数为,当日接种人数为y.参考公式:,.(1)若当日接种人数超过1.8万人,则认为“接种繁忙”,从前4天中随机选择2天,求这2天接种繁忙的概率;(2)若y关于具有线性相关关系,求y关于x的线性回归方程;(3)根据所求的线性回归方程分别计算星期五,星期六的预报值,并与当日接种人数的真实值y进行比较.若满足,则可用此回归方程预测以后的接种人数,并预测星期日的接种人数a;若不满足,请说明理由.【答案】见解析【解析】(1)解:记 “这2天接种繁忙”为事件,所以(2)解:由表格可知,所以,故y关于x的线性回归方程为(3)解:当时,;当时,不满足,即不可用此回归方程预测以后的接种人
35、数9(2022安阳模拟)共享汽车,是指许多人合用一辆车,即开车人对车辆只有使用权,而没有所有权,有点类似于在租车行业里的短时间的租车它手续简便,打个电话或通过网上就可以预约订车某市为了了解不同年龄的人对共享汽车的使用体验,随机选取了100名使用共享汽车的体验者,让他们根据体验效果进行评分附:回归直线 的斜率 相关系数 独立性检验中的 ,其中 临界值表:0.0500.0100.0013.8416.63510.828(1)设消费者的年龄为x,对共享汽车的体验评分为y若根据统计数据,用最小二乘法得到y关于x的线性回归方程为 ,且年龄x的方差为 ,评分y的方差为 求y与x的相关系数r,并据此判断对共享
36、汽车使用体验的评分与年龄的相关性强弱(当 时,认为相关性强,否则认为相关性弱) (2)现将100名消费者的年龄划分为“青年”和“中老年”,评分划分为“好评”和“差评”,整理得到如下数据,请将 列联表补充完整并判断是否有99.9%的把握认为对共享汽车的评价与年龄有关 好评差评合计青年16 中老年 12 合计 44100【答案】见解析【解析】(1)解:因为 ,所以 , 因为 ,所以 ,因为 ,所以 ,所以相关系数 ,因为 ,所以可以判断对共享汽车使用体验的评分与年龄的相关性很强.(2)解:根据题意可得 列联表如下: 好评差评合计青年163248中老年401252合计5644100因为 ,所以有99
37、.9%的把握认为对共享汽车的评价与年龄有关.题组三 非线性回归方程1(2022广东铁一中学高三期末)年月底,为严防新型冠状病毒疫情扩散,有效切断病毒传播途径,坚决遏制疫情蔓延势头,确保人民群众生命安全和身体健康,多地相继做出了封城决定.某地在月日至日累计确诊人数如下表:日期(月)日日日日日日日人数(人)由上述表格得到如散点图(月日为封城第一天).(1)根据散点图判断与(,均为大于的常数)哪一个适宜作为累计确诊人数与封城后的天数的回归方程类型(给出判断即可,不必说明理由);并根据上表中的数据求出回归方程;(2)随着更多的医护人员投入疫情的研究,月日武汉影像科医生提出存在大量核酸检测呈阴性(阳性则
38、确诊),但观其肺片具有明显病变,这一提议引起了广泛的关注,月日武汉疾控中心接收了份血液样本,假设每份样本的检验结果是阳性还是阴性都是相互独立的,且每份样本是阳性样本的概率为,核酸试剂能把阳性样本检测出阳性结果的概率是(核酸检测存在阳性样本检测不出来的情况,但不会把阴性检测呈阳性),求这份样本中检测呈阳性的份数的期望.参考数据:其中,参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.【答案】(1)选择,关于的回归方程为;(2)期望为人.【解析】(1)由散点图可知选择,由两边同时取常用对数得,设,.计算,把样本中心点代入得.,关于的回归方程为;(2)这份样本中检测呈阳性的份
39、数为,则每份检测出阳性的概率,由题意可知,(人),故这份样本中检测呈阳性份数的期望为人.2(2022山西二模(理)数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表为20172021年中国在线直播用户规模(单位:亿人),其中2017年2021年对应的代码依次为15年份代码x12345市场规模y3.984.565.045.866.36(1)由上表数据可知,可用函数模型拟合y与x的关系,请建立y关于x的回归方程(,的值精确到0.01);(2)已知中国在线直播购物用户选择在品牌官方直播间购物的概率为p,现从中国在线直播购物用户中随机抽取4人,记这4人中选择在品牌官方直播间
40、购物的人数为X,若,求X的分布列与期望参考数据:,其中参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,【答案】(1)(2)分布列见解析;期望为【解析】(1)解:设,则,因为,所以把代入,得即关于的回归方程为(2)解:由题意知,由得所以,的取值依次为0,1,2,3,4,所以X的分布列为X01234P3(2022贵州模拟预测(理)某企业为加强科研创新,加大研发资金的投入,新研发了一种产品.该产品的生产成本由直接生产成本(如原料工人工资机器设备折旧等)和间接生产成本(如物料消耗管理人员工资车间房屋折旧等)组成.该产品的间接生产成本y(万元)与该产品的生产数量x(千件)有关,经
41、统计并对数据作初步处理,得到散点图及一些统计量的值.3.513.241.8117.51.4619.95.84表中,.(1)根据散点图判断与哪一个更适合作为间接生产成本y与该产品的生产数量x的回归方程类型;(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测生产9千件产品时,间接生产成本是多少万元;(3)为确保产品质量,该企业在生产过程中对生产的每件产品均进行五个环节的质量检测,若检测出不合格产品,则需在未进入下一环节前立即修复(修复后再进入下一环节),已知每个环节是相互独立的,且每个环节产品检测的合格率均为98%,各环节中不合格的一件产品所需的修复费用均为100元,求一件产品需修复