1、2.4线性回归方程学习目标1. 了解相关关系、线性相关的概念.2.会根据散点图判断数据是否具有相关关系.3.会求线性回归方程,并能根据线性回归方程做出合理判断知识点一变量之间的两类关系变量间的两类关系函数关系变量之间的关系可以用函数表示相关关系变量之间有一定的联系,但不能完全用函数来表达能用直线近似表示的相关关系叫线性相关关系知识点二散点图1散点图:将样本中n个数据点(xi,yi)(i1,2,n)描在平面直角坐标系中得到的图形叫散点图2利用散点图可以大致确定两个变量是不是有相关关系,以及相关性强弱知识点三最小平方法及线性回归方程1线性回归方程:能用直线方程bxa近似表示的相关关系叫做线性相关关
2、系,该方程叫线性回归方程2最小平方法是一种求回归直线的方法,用这种方法求得的回归直线能使样本数据的点到回归直线的距离的平方和最小3给出一组数据(x1,y1),(x2,y2),(xn,yn),用最小平方法求得线性回归方程的系数a,b满足上式还可以表示为1函数关系是一种确定关系,而相关关系是具有随机性的两个变量之间的关系()2函数关系是一种因果关系,而相关关系不一定是因果关系,也可以是伴随关系()3回归直线一定过样本点中心(,)()4根据线性回归方程公式,任给一组数据,均可以求出线性回归方程,并可以预报()题型一变量之间相关关系的判断例1在下列两个变量的关系中,哪些是相关关系?(1)正方形边长与面
3、积之间的关系;(2)作文水平与课外阅读量之间的关系;(3)人的身高与年龄之间的关系;(4)降雪量与交通事故发生率之间的关系解两变量之间的关系有:函数关系与带有随机性的相关关系(1)正方形的边长与面积之间的关系是函数关系(2)作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系(3)人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具备相关关系(4)降雪量与交通事故发生率之间具有相关关系反思感悟如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴含因果关系,从而发现
4、引起这种相关关系的本质原因是什么跟踪训练1有下列关系:老师的执教水平与学生的学习成绩之间的关系;曲线上的点与该点的坐标之间的关系;苹果的产量与气候之间的关系;森林中的同一种树木,其横截面直径与高度之间的关系;学生与其学号之间的关系其中有相关关系的是_(填序号)答案题型二散点图及应用例25名学生的数学和物理成绩(单位:分)如下:学生成绩ABCDE数学成绩8075706560物理成绩7066686462判断它们是否具有线性相关关系解以x轴表示数学成绩,y轴表示物理成绩,得相应的散点图如图所示由散点图可知,各点分布在一条直线附近,故两者之间具有线性相关关系反思感悟(1)判断两个变量x和y间是否具有线
5、性相关关系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响(2)画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论跟踪训练2根据下面四个散点图中点的分布状态,直观上判断两个变量之间具有线性相关关系的是_(填序号)答案解析散点图中的点无规则的分布,范围很广,表明两个变量之间的相关程度很小;中所有的点都在同一条直线上,是函数关系;中的点分布在一条带状区域上,即点分布在一条直线的附近,是线性相关关系;中的点也分布在一条带状区域内,但不是线性的,而
6、是在一条曲线附近,所以不是线性相关关系,故填.题型三求回归方程例3某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070(1)画出散点图;(2)求回归方程解(1)散点图如图所示(2)列出下表,并用科学计算器进行有关计算.i12345xi24568yi3040605070xiyi60160300300560x4162536645,50,145,iyi1 380于是可得,b6.5,ab 506.5517.5.于是所求的回归方程是6.5x17.5.反思感悟求回归方程的一般步骤(1)收集样本数据,设为(xi,yi)(i1,2,n)(2)作
7、出散点图,确定x,y具有线性相关关系(3)把数据制成表格(4)计算,iyi.(5)代入公式计算b,a,公式为(6)写出回归方程bxa.跟踪训练3已知变量x,y有如下对应数据:x1234y1345(1)作出散点图;(2)用最小二乘法求关于x,y的回归方程解(1)散点图如图所示(2),iyi16122039.1491630,b,a0,所以x即为所求的回归方程利用回归方程对总体进行估计典例由某种设备的使用年限xi(年)与所支出的维修费yi(万元)的数据资料算得如下结果,90,iyi112,i20,i25.(1)求所支出的维修费y对使用年限x的线性回归方程bxa;(2)判断变量x与y之间是正相关还是负
8、相关;当使用年限为8年时,试估计支出的维修费是多少?解(1)i20,i25,i4,i5,b1.2,ab 51.240.2.线性回归方程为1.2x0.2.(2)由(1)知b1.20,变量x与y之间是正相关由(1)知,当x8时,1.280.29.8,即使用年限为8年时,支出的维修费约是9.8万元素养评析(1)用回归方程进行总体估计要注意几点:首先要判断两个变量具有相关关系,准确求出回归方程,根据回归方程进行估计或预测,但估计值不是实际值,允许有一定误差(2)收集数据,求回归方程,进行估计和预测,充分体现了数学核心素养之数学运算和数据分析素养的形成过程1对变量x,y有观测数据(xi,yi)(i1,2
9、,3,10),得散点图1;对变量u,v有观测数据(ui,vi)(i1,2,3,10),得散点图2,由这两个散点图可以断定()Ax与y正相关,u与v正相关Bx与y正相关,u与v负相关Cx与y负相关,u与v正相关Dx与y负相关,u与v负相关答案C解析由图1可知,点散布在从左上角到右下角的区域,各点整体呈递减趋势,故x与y负相关;由图2可知,点散布在从左下角到右上角的区域,各点整体呈递增趋势,故u与v正相关2工人工资y(元)与劳动生产率x(千元)的相关关系的回归方程为5080x,下列判断正确的是()A劳动生产率为1 000元时,工人工资为130元B劳动生产率提高1 000元时,工人工资平均提高80元
10、C劳动生产率提高1 000元时,工人工资平均提高130元D当月工资为250元时,劳动生产率为2 000元答案B解析因为回归直线的斜率为80,所以x每增加1,y平均增加80,即劳动生产率提高1 000元时,工人工资平均提高80元3设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为5
11、8.79 kg答案D解析当x170时,0.8517085.7158.79,体重的估计值为58.79 kg.4正常情况下,年龄在18岁到38岁的人,体重y(kg)对身高x(cm)的线性回归方程为0.72x58.2,张明同学(20岁)身高178 cm,他的体重应该在_kg左右答案69.96解析用线性回归方程对身高为178 cm的人的体重进行预测,当x178时,0.7217858.269.96(kg)5某产品的广告费用x(万元)与销售额y(万元)的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得线性回归方程bxa中的b为9.4,据此模型预报广告费用为6万元时销售额为_万元答案65.5解析由题意可知3.5,42,则429.43.5a,a9.1,当x6时,9.469.165.5.1求样本数据的回归方程,可按下列步骤进行:第一步计算平均数,.第二步求和iyi,.第三步计算b,ab.第四步写出回归方程bxa.2回归方程被样本数据唯一确定,各样本点大致分布在回归直线附近对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性3对于任意一组样本数据,利用公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程