8.2一元线性回归模型及其应用 学案(教师版)

上传人:热*** 文档编号:231432 上传时间:2023-01-01 格式:DOCX 页数:46 大小:1.63MB
下载 相关 举报
8.2一元线性回归模型及其应用 学案(教师版)_第1页
第1页 / 共46页
8.2一元线性回归模型及其应用 学案(教师版)_第2页
第2页 / 共46页
8.2一元线性回归模型及其应用 学案(教师版)_第3页
第3页 / 共46页
8.2一元线性回归模型及其应用 学案(教师版)_第4页
第4页 / 共46页
亲,该文档总共46页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、8.2一元线性回归模型及其应用【知识点梳理】1一元线性回归模型我们称为Y关于x的一元线性回归模型,其中Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bxa之间的随机误差2线性回归方程与最小二乘法回归直线方程过样本点的中心(,),是回归直线方程最常用的一个特征我们将x称为Y关于x的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计(least squares estimate ),其中3残差的概念对于响应变量Y,通过观测得到的数据称为观测值,

2、通过经验回归方程得到的称为预测值,观测值减去预测值称为残差残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析4刻画回归效果的方式(1)残差图法作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好(2)残差平方和法残差平方和 (yii)2,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差(3)利用R2刻画回归效果决定系数R2是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预

3、报变量的能力R21,R2越大,即拟合效果越好,R2越小,模型拟合效果越差【典型例题】题型一求回归直线方程例1(2022甘肃临泽县第一中学高二阶段练习(文)已知变量和正相关,则由如下表所示的观测数据算得的线性回归方程为ABCD【答案】B【解析】【分析】先求出样本的中心点的坐标,再代入选项检验即得正确答案.【详解】由题得,所以样本中心点的坐标为(0,0),代入选项检验得选B.故答案为B【点睛】(1)本题主要考查回归方程直线的性质,意在考查学生对该知识的掌握水平.(2) 称为样本点的中心,回归直线过样本点的中心.这是回归方程的一个重要考点,要理解掌握并灵活运用.规律方法求线性回归方程的一般步骤(1)

4、收集样本数据,设为(xi,yi)(i1,2,n)(数据一般由题目给出)(2)作出散点图,确定x,y具有线性相关关系(3)把数据制成表格xi,yi,x,xiyi.(4)计算,x,xiyi.(5)代入公式计算,公式为(6)写出线性回归方程x.例2(2019新疆乌鲁木齐市第二十中学高二期中)随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限与所支出的总费用(万元)有如表的数据资料:使用年限23456总费用2.23.85.56.57.0(1

5、)在给出的坐标系中作出散点图;(2)求线性回归方程中的、;(3)估计使用年限为年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式, .)【答案】(1)见解析; (2) ; (3)估计使用12年时,支出总费用是14.84万元.【解析】【分析】(1)在坐标系中描点可得散点图;(2)代入公式可求;(3)根据方程代入x=12可得费用.【详解】(1)散点图如图,由图知与间有线性相关关系 (2),; (3)线性回归直线方程是,当(年)时,(万元)即估计使用12年时,支出总费用是14.84万元【点睛】本题主要考查回归直线在生活中的应用,明确所给公式中各个模块的含义,代入公式可求.题目难度不大,侧

6、重于应用性.例3(2022全国高二单元测试)有一位同学家里开了一个小卖部,他为了研究气温对热茶销售的影响,经过统计,得到一个卖出热茶杯数与当天气温的对比表如下:气温x/-504712151923273136热茶销售杯数y/杯15615013212813011610489937654(1)画出散点图;(2)你能从散点图中发现气温与热茶的销售杯数之间关系的一般规律吗?(3)如果近似成线性关系的话,请画出一条直线来近似地表示这种线性关系;(4)试求出回归直线方程;(5)利用(4)的回归方程,若某天的气温是2 ,预测这一天卖出热茶的杯数.【答案】(1)见解析;(2)见解析;(3)见解析;(4);(5)

7、143【解析】【详解】分析:(1)以x轴表示气温,以y轴表示热茶杯数,可作散点图;(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越高,卖出去的热茶杯数越少;(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系;(4)由题中所给的数据求得回归方程即可;(5)结合回归方程的预测作用和(4)中的结论整理计算即可求得最终结果.详解:(1)以x轴表示气温,以y轴表示热茶杯数,可作散点图如下图所示.(2)从图中可以看出,各点散布在从左上角到右下角的区域里,因此热茶的销售杯数与气温是相关的,气温越

8、高,卖出去的热茶杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线附近,根据不同的标准可以画出不同的直线来近似地表示这种线性相关关系,如图所示.(4)因335,778.所-2.35,所以回归直线方程(5)由(4)的方程,当x=22 ,这一天大约可以卖出143杯热茶.点睛:(1)正确运用计算,的公式和准确的计算,是求线性回归方程的关键(2)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值题型二利用回归直线方程对总体进行估计例4(2022江西抚州高二期末(理)保护生态环境,提倡环保出行,节约资源和保护环境,某地区从2016年开始大力提倡新

9、能源汽车,每年抽样1000汽车调查,得到新能源汽车y辆与年份代码x年的数据如下表:年份20162017201820192020年份代码第x年12345新能源汽车y辆305070100110(1)建立y关于x的线性回归方程;(2)假设该地区2022年共有30万辆汽车,用样本估计总体来预测该地区2022年有多少新能源汽车参考公式:回归方程斜率和截距的最小二乘估计公式分别为,【答案】(1)(2)27900【解析】【分析】(1)第一步分别算第x,y的平均值,第二步利用,即可得到方程.(2)由第一问的结果,带入方程即可算出预估的结果.(1),因为,所以,所以(2)预测该地区2022年抽样1000汽车调查

10、中新能源汽车数,当时,该地区2022年共有30万辆汽车,所以新能源汽车.规律方法本题已知y与x是线性相关关系,所以可求出回归方程进行估计和预测否则,若两个变量不具备相关关系或它们之间的相关关系不显著,即使求出回归方程也毫无意义.例5(2021陕西西安中学高二期中(理)偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个同学的某科考试成绩与该科班平均分的差叫某科偏差(实际成绩平均分偏差).在某次考试成绩统计中,某老师为了对学生数学偏差(单位:分)与物理偏差(单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下:学生序号12345678数学偏差20151332

11、-5-10-18物理偏差6.53.53.51.50.5-0.5-2.5-3.5(1)若与之间具有线性相关关系,求关于的线性回归方程;(2)若该次考试该数学平均分为120分,物理平均分为91.5分,试由(1)的结论预测数学成绩为128分的同学的物理成绩.(下面是参考数据和参考公式),回归直线方程为,其中【答案】(1)(2)【解析】【分析】(1)根据最小二乘法即可求出关于的线性回归方程;(2)设该同学的物理成绩为,则物理偏差为,数学偏差为,根据回归方程可知,即可解出(1)由题意可得,所以,故线性回归方程为.(2)由题意,设该同学的物理成绩为,则物理偏差为:.而数学偏差为128-120=8,解得,所

12、以,可以预测这位同学的物理成绩为94.例6(2021广东揭阳高二期末)从2018年1月1日起,广东、等18个保监局所辖地区将纳入商业车险改革试点范围,其中最大的变化是上一年的出险次数决定了下一年的保费倍率,具体关系如下表:上一年的出险次数次以上(含次)下一年保费倍率连续两年没有出险打折,连续三年没有出险打折有评估机构从以往购买了车险的车辆中随机抽取1000 辆调查,得到一年中出险次数的频数分布如下(并用相应频率估计车辆每年出险次数的概率):一年中出险次数012345次以上(含5次)频数5003801001541(1)求某车在两年中出险次数不超过2次的概率;(2)经验表明新车商业车险保费与购车价

13、格有较强的线性相关关系,估计其回归直线方程为:.(其中(万元)表示购车价格,(元)表示商业车险保费).李先生2016 年1月购买一辆价值20万元的新车.根据以上信息,试估计该车辆在2017 年1月续保时应缴交的保费,并分析车险新政是否总体上减轻了车主负担.(假设车辆下一年与上一年都购买相同的商业车险产品进行续保)【答案】(1)0.8744;(2)3846元,减轻了车主负担.【解析】【分析】(1)利用互斥事件的概率公式列式计算即得;(2)求出下一年车险保费倍率X的分布列,并求出期望,即可得出车主下一年的保费,并根据期望是否大于1得出结论.【详解】(1)设某车在两年中出险次数为N,则,所以某车在两

14、年中出险次数不超过2次的概率为;(2)设该车辆2017 年的保费倍率为X ,则X 为随机变量,X的取值为0.85 ,1,1.25 ,1.5 ,1.75 , 2,X 的分布列为:X0.8511.251.51.752P0.500.380.100.0150.0040.001下一年保费倍率X 的期望为:,该车辆估计2017年应缴保费为:元,因,则车险新政总体上减轻了车主负担.题型三线性回归分析例7(2021山东日照青山学校高二期末)共享单车进驻城市,绿色出行引领时尚,某市有统计数据显示,某站点6天的使用单车用户的数据如下,用两种模型;分别进行拟合,得到相应的回归方程,进行残差分析得到如表所示的残差值及

15、一些统计量的值:日期x(天)123456用户y(人)132243455568模型的残差值1.12.87.51.21.90.4模型的残差值0.35.44.33.21.63.8(1)残差值的绝对值之和越小说明模型拟合效果越好,根据残差,比较模型,的拟合效果,应选择哪一个模型?并说明理由;(2)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(1)中所选模型的回归方程.(参考公式:,)【答案】(1)该选模型,理由见解析(2)【解析】【分析】(1)求出两模型的残差值的绝对值之和进行比较即可,(2)先剔除异常数据,然后利用回归方程的公式结合已知数据进行计算即可(1)应该选择模型模

16、型的残差值的绝对值之和为1.1+2.8+7.5+1.2+1.9+0.414.9模型的残差值的绝对值之和为0.3+5.4+4.3+3.2+1.6+3.818.6.14.918.6,模型的拟合效果较好,应该选模型.(2)剔除异常数据,即剔除第3天的数据后,得,.,.y关于x的回归方程为.规律方法(1)解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析(2)刻画回归效果的三种方法残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适残差平方

17、和法:残差平方和 (yii)2越小,模型的拟合效果越好决定系数法:R21越接近1,表明回归的效果越好例8(2021河南南阳中学高三阶段练习(文)2021年6月17日9时22分,我国酒泉卫星发射中心用长征遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下:序号1234567891

18、01112x2346810132122232425y1522274048546068.56867.56665当时,建立了y与x的两个回归模型:模型:,模型:;当时,确定y与x满足的线性回归方程为(1)根据下列表格中的数据,比较当时模型,的相关指数的大小,并选择拟合精度更高、更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益;回归模型模型模型回归方程79.1320.2(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益国家补贴)的大小附:

19、刻画回归效果的相关指数,且当越大时,回归方程的拟合效果越好用最小二乘法求线性回归方程的截距:【答案】(1)对A型材料进行应用改造的投入为17亿元时的直接收益为(亿元);(2)投入17亿元比投入20亿元时收益小.【解析】【分析】(1)根据模型和相关系数公式计算比较即可,然后将x17代入较好的模型即可预测直接收益;(2)根据回归方程过样本中心点()求出,再令x20算出预测的直接收益,即可算出投入20亿元时的总收益,与(1)中的投入17亿元的直接收益比较即可.(1)对于模型,对应的,故对应的,故对应的相关指数,对于模型,同理对应的相关指数,故模型拟合精度更高、更可靠.故对A型材料进行应用改造的投入为

20、17亿元时的直接收益为(亿元).另解:本题也可以根据相关系数的公式,直接比较79.13和20.2的大小,从而说明模型拟合精度更高、更可靠.(2)当时,后五组的,由最小二乘法可得,故当投入20亿元时公司收益(直接收益国家补贴)的大小为:,故投入17亿元比投入20亿元时收益小.例9(2022陕西高新一中高三阶段练习(理)2021年6月17日9时22分,我国酒泉卫星发射中心用长征遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜刘伯明汤洪波名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公

21、司为了将型材料更好地投入商用,拟对型材料进行应用改造.根据市场调研与模拟,得到应用改造投入(亿元)与产品的直接收益(亿元)的数据统计如下:序号123456723468101315222740485460当时,建立了y与x的两个回归模型:模型:,模型:;当时,确定y与x满足的线性回归方程为.回归模型模型模型79.1320.2(1)根据表格中的数据,比较当时模型,的相关指数的大小,并选择拟合精度更高更可靠的模型,预测对型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更

22、可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数,且当越大时,回归方程的拟合效果越好.用最小二乘法求线性回归方程的截距:.【答案】(1),模型拟合精度更高更可靠,收益为;(2)投入17亿元比投入20亿元时收益小.【解析】【分析】(1)根据题意求得,再根据的计算公式,即可分别求得,则可判断不同模型的拟合度;(2)根据题意,求得回归直线方程,即可代值计算,求得预测值.(1)对于模型,对应的,故对应的,故对应的相关指数,对于模型,同理对应的相关指数,故模型拟合精度更高更可靠.故对型材料进行应用改造的投入为17亿元时的直接收益为.(2)当时,后五

23、组的,由最小二乘法可得,故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:,故投入17亿元比投入20亿元时收益小.题型四残差分析与相关指数的应用例10(2021河北藁城新冀明中学高二阶段练习)假定产品产量x(千件)与单位成本y(元/件)之间存在相关关系.数据如下:x234345y737271736968(1)以x为解释变量,y为预报变量,作出散点图;(2)求y与x之间的回归直线方程,对于单位成本70元/件时,预报产量为多少;(3)计算各组残差,并计算残差平方和;【答案】(1)散点图见解析;(2),千件;(3)各组残差见解析,残差平方和为.【解析】【分析】(1)根据表中数据描点即可求解;

24、(2)根据表中数据,求出,代入公式求出线性回归方程的系数,进而求出即可得回归直线方程;(3)根据残差的定义及残差平方和公式即可求解.(1)解:散点图如下:(2)解:因为,所以,所以回归直线方程为,令,则,解得,所以单位成本70元/件时,预报产量约为千件.(3)解:各组残差分别为:,残差的平方和为.规律方法(1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差1,2,n来判断模型拟合的效果(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高例11(2021河北大名县第一中学

25、高二阶段练习)随着中美贸易战的不断升级,越来越多的国内科技巨头加大了科技研发投入的力度.华为技术有限公司拟对“麒麟”手机芯片进行科技升级,根据市场调研与模拟,得到科技升级投入x(亿元)与科技升级直接收益y(亿元)的数据统计如下:序号123456789101112x2346810132122232425y1322314250565868.56867.56666当时,建立了y与x的两个回归模型:模型:;模型:;当时,确定y与x满足的线性回归方程为.(1)根据下列表格中的数据,比较当时模型、的相关指数的大小,并选择拟合精度更高、更可靠的模型,预测对“麒麟”手机芯片科技升级的投入为17亿元时的直接收益

26、.回归模型模型模型回归方程182.479.2(附:刻画回归效果的相关指数,)(2)为鼓励科技创新,当科技升级的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,比较科技升级投入17亿元与20亿元时公司实际收益的大小.附:用最小二乘法求线性回归方程的系数:【答案】(1)回归模型,72.93(亿元);(2)投入20亿元时,公司的实际收益更大.【解析】【分析】(1)根据表中数据比较和可判断拟合效果,进而求出预测值;(2)求出,进而求出,得出回归方程得求出结果.【详解】解:(1)由表格中的数据, 可见模型的相关指数小于模型的相关指数. 所以回归模型的拟合效果更好. 所以当亿元时,科技

27、升级直接收益的预测值为(亿元).(2)当时,由已知可得,. 当时,y与x满足的线性回归方程为.当时,科技升级直接收益的预测值为亿元. 当亿元时,实际收益的预测值为亿元亿元, 技术升级投入20亿元时,公司的实际收益更大.题型五非线性回归分析例12(2022全国模拟预测)某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次,统计数据如下表所示:x1234567y611213466101196根据以上数据

28、,绘制了如图所示的散点图.(1)根据散点图,判断在推广期内,与(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及题干中表格内的数据,建立y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:62.141.54253550.123.47其中,.参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.(3)推广期结束后,为更好地服务乘客,车队随机调查了100人次的乘车支付方式,得到如下结果:支付方式现金公交卡扫码人次106030已知该线路公交车票价2元,使用现金支付的

29、乘客无优惠,使用公交卡支付的乘客享受8折优惠,扫码支付的乘客随机优惠,根据调查结果发现:使用扫码支付的乘客中有5人次乘客享受7折优惠,有10人次乘客享受8折优惠,有15人次乘客享受9折优惠.预计该车队每辆车每个月有1万人次乘车,根据所给数据,以事件发生的频率作为相应事件发生的概率,在不考虑其他因素的条件下,按照上述收费标准,试估计该车队一辆车一年的总收入.【答案】(1)适宜(2),活动推出第8天使用扫码支付的人次为347(3)199200元【解析】【分析】(1)根据散点图即可判断回归方程类型;(2)根据题意中的数据,利用最小二乘法求出,进而求出,即可得出回归方程,令求解即可;(3)根据题意分别

30、求出享受7折优惠、8折优惠、9折优惠的收入,进而加起来即可.(1)根据散点图判断,适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型.(2),两边同时取常用对数,得.设,则.,把代入上式,得,y关于x的回归方程为,活动推出第8天使用扫码支付的人次为347.(3)由题意,可知一个月中使用现金的乘客有1000人次,共收入(元);使用公交卡的乘客有6000人次,共收入(元).使用扫码支付的乘客有3000人次,其中,享受7折优惠的有500人次,共收入(元),享受8折优惠的有1000人次,共收入(元),享受9折优惠的有1500人次,共收入(元),故该车队一辆车一个月的收入为(元).估计该车队一辆车

31、一年的收入为(元).规律方法求非线性回归方程的步骤(1)确定变量,作出散点图(2)根据散点图,选择恰当的拟合函数(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程(4)分析拟合效果:通过计算决定系数或画残差图来判断拟合效果(5)根据相应的变换,写出非线性回归方程例13(2022黑龙江哈尔滨市第六中学校高二期末)区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术区块链作为构造信任的机器,将可能彻底改变整个人类社会价值传递的方式,2015年至2019年五年期间,中国的区块链企业数量逐年增长,居世界前列现收集我国近5年区块链企业总数量相关数据,如表年

32、份20152016201720182019编号x12345企业总数量y(单位:千个)2.1563.7278.30524.27936.224注:参考数据,(其中).附:样本的最小二乘法估计公式为,(1)根据表中数据判断,与(其中,为自然对数的底数),哪一个回归方程类型适宜预测未来几年我国区块链企业总数量?(给出结果即可,不必说明理由)(2)根据(1)的结果,求y关于x的回归方程;(3)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛比赛规则如下:每场比赛有两个公司参加,并决出胜负;每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;在比

33、赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司就获得此次信息化比赛的“优胜公司”,已知在每场比赛中,甲胜乙的概率为,甲胜丙的概率为,乙胜丙的概率为,若首场由甲乙比赛,则求甲公司获得“优胜公司”的概率.【答案】(1)(2)(3)【解析】【分析】(1)根据表中数据判断y关于x的回归方程为非线性方程;(2)令,将y关于x的非线性关系,转化为z关于x的线性关系,利用最小二乘法求解;(3)利用相互独立事件的概率相乘求求解;(1)根据表中数据适宜预测未来几年我国区块链企业总数量.(2),令,则,由公式计算可知,即,即所以y关于x的回归方程为(3)设甲公司获得“优胜公司”为事件.则所以甲公司获得“优

34、胜公司”的概率为.例14(2021湖南长沙一中高三阶段练习)数独是源自18世纪瑞士的一种数学游戏,玩家需要根据99盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(33)内的数字均含1-9,不重复数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛(1)赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度y(秒)与训练天数x(天)有关,经统计得到如表的数据:x(天)1234567y(秒)990990450320300240210现用作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过50天训练后,每天解题的平均速度y约为多少秒?(2)

35、小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛若小明每局获胜的概率为,已知在前3局中小明胜2局,小红胜1局若每局不存在平局,请你估计小明最终赢得比赛的概率参考数据(其中)18450.370.55参考公式:对于一组数据(,),(,),(,),其回归直线的斜率和截距的最小二乘估计公式分别为:,【答案】(1);150秒(2)【解析】【分析】(1)首先换元,令,设y关于t的线性回归方程为,利用参考公式,即可求解;(2)首先根据题意写出随机变量,,再利用独立事件概率公式,即可求解.(1)由题意,令,设y关于t的线性回归方程为,则,则,又,

36、y关于x的回归方程为,故时,经过50天训练后,每天解题的平均速度y约为150秒(2)设比赛再继续进行X局小明最终赢得比赛,则最后一局一定是小明获胜,由题意知,最多再进行4局就有胜负当时,小明胜,当时,小明胜,;当时,小明胜,小明最终赢得比赛的概率为【同步练习】一、单选题1(2022黑龙江哈尔滨三中一模(文)某产品的广告费用与销售额的统计数据如下表:广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程中的为9.4,据此模型预报广告费用为7万元时销售额为()A73万元B81.4万元C77.1万元D74.9万元【答案】D【解析】【分析】先求样本中心点为,进而得,回归方程为,再代

37、入计算即可得答案.【详解】解:由题知,因为回归方程过定点,所以,即所以回归方程为,所以当广告费用为7万元时销售额为万元.故选:D2(2022四川高三阶段练习(文)某制衣品牌为使成衣尺寸更精准,选择了10名志愿者,对其身高(单位:)和臂展(单位:)进行了测量,这10名志愿者身高和臂展的折线图如图所示已知这10名志愿者身高的平均值为,根据这10名志愿者的数据求得臂展关于身高的线性回归方程为,则下列结论不正确的是()A这10名志愿者身高的极差小于臂展的极差B这10名志愿者的身高和臂展呈正相关关系C这10名志愿者臂展的平均值为176.2cmD根据回归方程可估计身高为160cm的人的臂展为158cm【答

38、案】C【解析】【分析】利用平均值、极差、线性回归方程的特征进行逐项判断.【详解】解:对于选项A:因为这10名志愿者臂展的最大值大于身高的最大值,而臂展的最小值小于身高的最小值,所以这10名志愿者身高的极差小于臂展的极差,故A正确对于选项B:因为,所以这10名志愿者的身高和臂展呈正相关关系,故B正确对于选项C:因为这10名志愿者身高的平均值为176cm,所以这10名志愿者臂展的平均值为,故C错误对于选项D:若一个人的身高为160cm,则由回归方程,可得这个人的臂展的估计值为158cm,故D正确故选:C3(2022全国高二单元测试)某公司为了解某产品的研发费x(单位:万元)对销售量y(单位:百件)

39、的影响,收集了该公司以往的5组数据,发现用函数模型(e为自然对数的底数)拟合比较合适令,得到,经计算,x,z对应的数据如下表所示:研发费x581215204.55.25.55.86.5则()ABCD【答案】B【解析】【分析】利用回归直线过样本中心点求出的值,从而得到回归方程,再利用得出,的值,从而可得出答案【详解】解:,所以,解得,所以,又因为,所以,所以,所以故选:B.4(2022天津滨海新高三阶段练习)下列说法不正确的是:()A线性回归直线一定过点B数据,的平均数为,则,的平均数为C数据,的第百分位数为D随机变量,其正态曲线是单峰的,它关于直线对称【答案】C【解析】【分析】根据线性回归直线

40、的性质,平均值的定义,百分位数的概念,正态曲线的性质判断各选项,【详解】线性回归直线一定过其中心点,A正确;由得,B正确;数据,应重新排列为,其第百分位数为3,C错;由正态曲线的性质知D正确故选:C5(2022广西百色高二期末(理)某工厂节能降耗技术改造后,在生产某产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据如下表,现发现表中有个数据看不清,已知回归直线方程为=6.3x+6.8,下列说法正确的是()x23456y19254044A看不清的数据的值为33B回归系数6.3的含义是产量每增加1吨,相应的生产能耗实际增加6.3吨C据此模型预测产量为8吨时,相应的生产能耗为50.9

41、吨D回归直线=6.3x+6.8恰好经过样本点(4,)【答案】D【解析】【分析】根据回归直线方程的性质和应用,对每个选项进行逐一分析,即可判断和选择.【详解】对A:因为,将代入,故,故A错误;对,回归系数6.3的含义是产量每增加1吨,相应的生产能耗大约增加6.3吨,故错误;对,当时,故错误;对,因为,故必经过,故正确.故选:.6(2022广西玉林高二期末(文)如果在一实验中,测得的四组数值分别是,则y与x之间的回归直线方程是()ABCD【答案】B【解析】【分析】根据已知数据求样本中心点,由样本中心点在回归直线上,将其代入各选项的回归方程验证即可.【详解】由题设,因为回归直线方程过样本点中心,A:

42、,排除;B:,满足;C:,排除;D:,排除.故选:B7(2022吉林双辽市第一中学高三期末(文)新能源汽车是指采用非常规的车用燃料作为动力来源(或使用常规的车用燃料、采用新型车载动力装置),综合车辆的动力控制和驱动方面的先进技术,形成的技术原理先进、具有新技术、新结构的汽车新能源汽车包括混合动力电动汽车(HEV)、纯电动汽车(BEV,包括太阳能汽车)、燃料电池电动汽车(FCEV)、其他新能源(如超级电容器、飞轮等高效储能器)汽车等非常规的车用燃料指除汽油、柴油之外的燃料下表是2021年我国某地区新能源汽车的前5个月销售量与月份的统计表:月份代码x12345销售量y(万辆)0.50.611.41.5由上表可知其线性回归方程为,则的值是()A0.28B0.32C0.56D0.64【答案】A【解析】【分析】先计算,

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 高中 > 高中数学 > 人教A版(2019) > 选择性必修第二册