1、2.4 线性回归方程,第2章 统计,学习目标 1.了解相关关系、线性相关的概念; 2.会根据散点图判断数据是否具有相关关系; 3.会求线性回归方程,并能根据线性回归方程做出合理判断.,题型探究,问题导学,内容索引,当堂训练,问题导学,知识点一 相关关系,思考,数学成绩y与学习数学所用时间t之间的关系,能否用函数关系刻画?,一般来说,学数学的时间越长,成绩越好.但用时10小时,数学成绩却不是一个确定的数字.故不能用函数关系刻画.,答案,梳理,相关关系: 与函数关系不同,相关关系是一种变量之间 的联系,但不是_的关系.,性,有一定,确定,知识点二 散点图,1.散点图:将样本中n个数据点(xi,yi
2、)(i1,2,n)描在平面直角坐标系中得到的图形. 2.利用散点图可以大致确定两个变量是不是有相关关系,以及相关性强弱.,知识点三 最小平方法及线性回归方程,思考1,若散点大致分布在一条直线附近,如何确定这条直线比较合理?,应该使散点整体上最接近这条直线.,答案,思考2,任何一组数据都可以由最小二乘法得出线性回归方程吗?,用最小二乘法求线性回归方程的前提是先判断所给数据是否具有线性相关关系(可利用散点图来判断),否则求出的线性回归方程是无意义的.,答案,梳理,线性回归方程: 能用直线方程 近似表示的相关关系叫做 关系,该方程叫 . 最小平方法是一种求回归直线的方法,用这种方法求得的回归直线能使
3、样本数据的点到回归直线的距离的平方和最小.,线性回归方程,线性相关,给出一组数据(x1,y1),(x2,y2),(xn,yn),用最小平方法求得线性回归方程的系数a,b满足,上式还可以表示为,题型探究,类型一 变量之间相关关系的判断,例1 在下列两个变量的关系中,哪些是相关关系? (1)正方形边长与面积之间的关系;,两变量之间的关系有:函数关系与带有随机性的相关关系.正方形的边长与面积之间的关系是函数关系.,解答,(2)作文水平与课外阅读量之间的关系;,作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.,解答,(3)人的身高与年龄之间的关系;,人的身高与年龄之间
4、的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具备相关关系.,解答,(4)降雪量与交通事故发生率之间的关系.,降雪量与交通事故发生率之间具有相关关系.,解答,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.,反思与感悟,跟踪训练1 有下列关系: 老师的执教水平与学生的学习成绩之间的关系; 曲线上的点与该点的坐标之间的关系; 苹果的产量与气候之间的关系; 森林中的同一种树木,其横截面直径与高度之间的关系; 学生与其学号之间的关系. 其中有相关关系的是
5、_.(填序号),答案,类型二 散点图及应用,例2 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:,画出散点图,分析年龄与人体脂肪含量的关系.,解答,散点图如下:在散点图中,点分布在从左下角到右上角的区域,故人的年龄与人体脂肪含量是相关关系.,画散点图时应注意合理选择单位长度,避免图形过大或过小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.相关关系的散点图不一定分布在一条直线附近,也可能是曲线.,反思与感悟,跟踪训练2 下表为我国在公元1000年到2000年间的人口数量. (1)试画出散点图;,解答,散点图如下:,(2)年份与人口是相关关系吗?如果是,是正
6、相关还是负相关?你觉得用什么函数模型模拟效果比较好?,由图可知,我国在1000年到2000年间的人口数量与年份是相关关系,且为正相关.因为增长速度越来越快, 用指数模型模拟效果比较合适.,解答,函数关系与相关关系之间有密切联系,可以用函数关系来模拟相关关系,也可借助散点图来发现两变量之间的函数关系,在一定条件下,两种关系还可相互转化.,反思与感悟,类型三 线性回归方程的求法及应用,例3 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否具有线性相关关系.如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,说明理由.,解答,在直角坐标系中画出数据的
7、散点图如图:直观判断散点在一条直线附近,故具有线性相关关系.,从而计算相应的数据之和:,反思与感悟,跟踪训练3 下表数据是退水温度x()对黄酮延长性y(%)效应的试验结果,y是以延长度计算的,且对于给定的x,y为正态变量,其方差与x无关.,(1)画出散点图;,解答,散点图如图:,(2)指出x,y是否线性相关;,由散点图可以看出样本点分布在一条直线的附近,可见y与x线性相关.,解答,(3)若线性相关,求y关于x的线性回归方程;,解答,列出下表并用科学计算器进行有关计算.,于是可得,(4)估计退水温度是1 000时,黄酮延长性的情况.,解答,将x1 000代入线性回归方程得0.058 861 00
8、024.62783.487, 即退水温度是1 000时,黄酮延长性大约是83.487%.,当堂训练,1.下列两个变量之间的关系,哪个不是函数关系_. 正方体的棱长和体积; 圆半径和圆的面积; 正n边形的边数和内角度数之和; 人的年龄和身高.,都是函数关系,人的年龄和身高是一种不确定的关系,故不是函数关系.,答案,解析,2,3,4,1,2.如图所示的五组数据(x,y)中,去掉_后,剩下的4组数据相关性增强.,2,3,4,1,去除(4,10)后,其余四点大致分布在一条直线附近,相关性增强.,(4,10),答案,解析,3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据
9、一组样本数据(xi,yi)(i1,2,n),用最小平方法建立的线性回归方程为 0.85x85.71,则下列结论中不正确的是_. 体重y与身高x具有函数间的关系; 回归直线过 点; 若该大学某女生身高增加1 cm,则其体重约增加0.85 kg; 若该大学某女生身高为170 cm,则可判定其体重必为58.79 kg.,2,3,4,1,体重与身高的关系不确定,不是函数关系.当x170时, 0.85170 85.7158.79,体重的估计值为58.79 kg.,答案,解析,4.某产品的广告费用x与销售额y的统计数据如下表:,2,3,4,1,根据上表可得线性回归方程 bxa中的b为9.4,据此模型预报广告费用为6万元时销售额为_万元.,65.5,答案,解析,规律与方法,1.求样本数据的回归方程,可按下列步骤进行:,2.回归方程被样本数据唯一确定,各样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性. 3.对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.,本课结束,