1、1.1 回归分析的基本思想及其初步应用,第一章 统计案例,学习目标 1.了解回归分析的必要性及其一般步骤. 2.了解随机误差的概念. 3.会作散点图,并会求回归直线方程. 4.利用残差分析来判断线性回归模型的拟合效果. 5.掌握建立回归模型的基本步骤,并通过实例进一步学习回归分析的基本思想及其初步应用.,题型探究,问题导学,内容索引,当堂训练,问题导学,思考1,知识点一 回归分析的相关概念,相关关系是确定性关系吗?,答案,答案 相关关系是一种不确定性的关系.,思考2,请问产生随机误差的主要原因有哪些?,答案,答案 (1)所选用的模型不恰当; (2)忽略了某些因素的影响; (3)存在测量误差.,
2、(1)回归分析是对具有 的两个变量进行统计分析的一种常用方法.若两个变量之间具有线性相关关系,则称相应的回归分析为 .,梳理,相关关系,线性回归分析,(3)样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数ybxa来描述它们之间的关系,而是用线性回归模型_ 来表示,其中 为模型的未知参数, 称为随机误差,自变量x称为变量,因变量y称为 变量.,ybxae,a和b,e,解释,预报,思考,知识点二 回归模型的模拟效果,如何评价回归模型拟合效果的优劣?,答案,答案 计算相关指数R2的值,R2越接近于1,效果就越好.,梳理,残差,样本编号,身高数,据,体重估计,越窄,越小,解释,预报
3、,题型探究,例1 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:,解答,类型一 求线性回归方程,(1)请画出上表数据的散点图;,解 如图:,(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程,解答,(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.,解答,(1)求线性回归方程的基本步骤: 列出散点图,从直观上分析数据间是否存在线性相关关系.,反思与感悟,写出线性回归方程并对实际问题作出估计. (2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归方程毫无意义.,跟踪训练1 假设关于某设备的使用年限x(年)和所支
4、出的维修费用y(万元)有如下的统计数据:,由此资料可知y对x呈线性相关关系. (1)求线性回归方程;,解答,(2)求使用年限为10年时,该设备的维修费用为多少?,即使用年限为10年时,该设备的维修费用为12.38万元.,解答,例2 为研究质量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同质量的6个物体进行测量,数据如表所示:,类型二 线性回归分析,(1)作出散点图并求线性回归方程;,解答,解 散点图如图所示,由散点图知y对x呈线性相关关系.,(2)求出R2;,解 R20.999 1.,解答,(3)进行残差分析.,解 由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数
5、据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与质量具有线性关系.,解答,引申探究 1.在条件不变的情况下,画出残差图.,解 如图所示.,解答,2.当x35时,估计y的值.,解 当x35时,y6.2850.1833512.69.,解答,(1)该类题属于线性回归问题,解答本题应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实
6、际问题进行分析.,反思与感悟,(2)刻画回归效果的三种方法 残差图法,残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适.,跟踪训练2 关于x与y有如下数据:,解答,当堂训练,1.某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:,答案,2,3,4,5,1,A.51个 B.50个 C.49个 D.48个,10915449,故选C.,解析,2.下表是x和y之间的一组数据,则y关于x的回归直线必过,答案,2,3,4,5,1,A.点(2,3) B.点(1.5,4) C.点(2.5,4) D.点(2.5,5),解析,3.若一组观测值(x1,y1),(x2
7、,y2),(xn,yn)之间满足yibxiaei (i1,2,n),且ei恒为0,则R2为_.,2,3,4,5,1,1,答案,解析,4.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量x(单位:千箱)与单位成本y(单位:元)的资料进行线性回归分析,结果如下:,2,3,4,5,1,1.818 2,答案,解析,即销量每增加1千箱,单位成本下降1.818 2元.,2,3,4,5,1,5.已知x、y之间的一组数据如下表:,2,3,4,5,1,x1y1x2y2x3y3x4y40113253734,,解答,(2)已知变量x与y线性相关,求出回归方程.,2,3,4,5,1,解答,规律与方法,回归分析的步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; (2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);,(4)按一定规则估计回归方程中的参数; (5)得出结果后分析残差图是否有异常(个别数据对应的残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是否合适等.,本课结束,