1、 1 回归分析回归分析 11 回归分析回归分析 学习目标 1.了解回归分析的思想,了解线性回归方程中公式的推导.2.掌握建立线性回归 模型的步骤 知识点 线性回归方程 思考 (1)什么叫回归分析? (2)回归分析中,利用线性回归方程求出的函数值一定是真实值吗? 答案 (1)回归分析是对具有相关关系的两个变量进行统计分析的一种方法 (2)不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重 与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、 是否喜欢运动等 梳理 (1)平均值的符号表示 假设样本点为(x1,y1),(x2,y2),(xn,yn
2、),在统计上,用 x 表示一组数据 x1,x2, xn的平均值,即 x x1x2xn n 1 n i1 n xi;用 y 表示一组数据 y1,y2,yn的平均值, 即 y y1y2yn n 1 n i1 n yi. (2)参数 a,b 的求法 blxy lxx i1 n xi x yi y i1 n xi x 2 i1 n xiyin x y i1 n x2in x 2 ,a y b x . 1现实生活中的两个变量要么是函数关系,要么是相关关系( ) 2散点图能准确判定两个变量是否具有线性相关关系( ) 3回归直线不一定过样本中的点,但一定过样本点的中心( ) 类型一 概念的理解和判断 例 1
3、 有下列说法: 线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法; 利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示; 通过回归方程 ybxa 可以估计观测变量的取值和变化趋势; 因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验 其中正确命题的个数是( ) A1 B2 C3 D4 考点 回归分析 题点 回归分析的概念和意义 答案 C 解析 反映的正是最小二乘法思想,正确;反映的是画散点图的作用,正确;反映的 是回归方程 ybxa 的作用,正确;不正确,在求回归方程之前必须进行相关性检验, 以体现两变量的关系 跟踪训练 1 下列变量
4、关系是相关关系的是( ) 学生的学习时间与学习成绩之间的关系; 某家庭的收入与支出之间的关系; 学生的身高与视力之间的关系; 球的体积与半径之间的关系 A B C D 考点 回归分析 题点 回归分析的概念和意义 答案 A 解析 对,学习时间影响学生的学习成绩,但是学生学习的刻苦程度、学生的学习方法、 教师的授课水平等其他因素也影响学生的成绩, 因此学生的学习时间与学习成绩之间具有相 关关系;对,家庭收入影响支出,但支出除受收入影响外,还受其他因素影响,故它们是 相关关系;对,身高与视力之间互不影响,没有任何关系;对,球的体积由半径决定, 是一种确定性关系,故它们是函数关系 类型二 回归分析 命
5、题角度1 求线性回归方程 例 2 某研究机构对高三学生的记忆力 x 和判断力 y 进行统计分析,得下表数据: x 6 8 10 12 y 2 3 5 6 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程 ybxa; (3)试根据求出的线性回归方程,预测记忆力为 9 的同学的判断力 相关公式:b i1 n xiyin x y i1 n x2in x 2 ,a y b x 考点 线性回归方程 题点 求线性回归方程 解 (1)如图: (2) i1 4 xiyi6283105126158, x 681012 4 9, y 2356 4 4, i
6、1 4 x2i6282102122344, b158494 344492 14 200.7, a y b x 40.792.3, 故线性回归方程为 y0.7x2.3. (3)由(2)中线性回归方程可知,当 x9 时,y0.792.34,预测记忆力为 9 的同学的判 断力约为 4. 反思与感悟 (1)求线性回归方程的基本步骤 列出散点图,从直观上分析数据间是否存在线性相关关系 计算: x , y , i1 n x2i, i1 n y2i, i1 n xiyi. 代入公式求出 ybxa 中参数 b,a 的值 写出线性回归方程并对实际问题作出估计 (2)需特别注意的是,只有在散点图大致呈线性时,求出
7、的回归方程才有实际意义,否则求 出的回归方程毫无意义 跟踪训练 2 已知某地区 410 岁女孩各自的平均身高数据如下: 年龄 x/岁 4 5 6 7 8 9 10 身高 y/cm 100 106 112 116 121 124 130 求 y 对 x 的线性回归方程(保留两位小数) 考点 线性回归方程 题点 求线性回归方程 解 制表 i 1 2 3 4 5 6 7 xi 4 5 6 7 8 9 10 yi 100 106 112 116 121 124 130 xiyi 400 530 672 812 968 1 116 1 300 x 7, y 809 7 , i1 7 x2i371, i1
8、 7 xiyi5 798 b i1 7 xiyi7 x y i1 7 x2i7 x 2 5 79877809 7 371772 4.82, a y b x 809 7 4.82781.83. 所以线性回归方程为 y81.834.82x. 命题角度2 线性回归分析与回归模型构建 例 3 某商场经营一批进价是 30 元/台的小商品, 在市场试验中发现, 此商品的销售单价 x(x 取整数)(元)与日销售量 y(台)之间有如下关系: x 35 40 45 50 y 56 41 28 11 (1)画出散点图,并判断 y 与 x 是否具有线性相关关系; (2)求日销售量 y 对销售单价 x 的线性回归方程
9、; (3)设经营此商品的日销售利润为 P 元,根据(2)写出 P 关于 x 的函数关系式,并预测当销售 单价 x 为多少元时,才能获得最大日销售利润 考点 线性回归分析 题点 回归直线方程的应用 解 (1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量 线性相关 (2)因为 x 1 4(35404550)42.5, y 1 4(56412811)34. i1 4 xiyi35564041452850115 410. i1 4 x2i3524024525027 350. 所以 b i1 4 xiyi4 x y i1 4 x2i4 x 2 5 410442.534 7 3
10、50442.52 370 125 3. a y b x 34(3)42.5161.5. 所以线性回归方程为 y161.53x. (3)依题意,有 P(161.53x)(x30) 3x2251.5x4 845 3 x251.5 6 2251.5 2 12 4 845. 所以当 x251.5 6 42 时,P 有最大值,约为 426 元即预测当销售单价为 42 元时,能获得 最大日销售利润 反思与感悟 该类题属于线性回归问题, 解答本类题目的关键是首先通过散点图来分析两变 量间的关系是否线性相关, 然后再利用求线性回归方程的公式求解线性回归方程, 在此基础 上,借助线性回归方程对实际问题进行分析
11、跟踪训练 3 一台机器由于使用时间较长,生产的零件有一些会缺损,按不同转速生产出来 的零件有缺损的统计数据如下表: 转速 x(转/秒) 16 14 12 8 每小时生产缺损零件数 y(件) 11 9 8 5 (1)作出散点图; (2)如果 y 与 x 线性相关,求出线性回归方程; (3)若在实际生产中,允许每小时的产品中有缺损的零件最多为 10 个,那么,机器的运转速 度应控制在什么范围? 考点 线性回归分析 题点 回归直线方程的应用 解 (1)根据表中的数据画出散点图如图 (2)设线性回归方程为:ybxa,并列表如下: i 1 2 3 4 xi 16 14 12 8 yi 11 9 8 5
12、xiyi 176 126 96 40 x 12.5, y 8.25, i1 4 x2i660, i1 4 xiyi438, 所以 b438412.58.25 660412.52 0.73, a8.250.7312.50.875,所以 y0.73x0.875. (3)令 0.73x0.87510,解得 x0 时,y0 不合题意,所以 C 错 2如图四个散点图中,适合用线性回归模型拟合其中两个变量的是( ) A B C D 考点 回归分析 题点 回归分析的概念和意义 答案 B 解析 由图易知两个图中样本点在一条直线附近,因此适合用线性回归模型 3下表是 x 和 y 之间的一组数据,则 y 关于 x
13、 的回归直线必过点( ) x 1 2 3 4 y 1 3 5 7 A.(2,3) B(1.5,4) C(2.5,4) D(2.5,5) 考点 线性回归方程 题点 样本点中心的应用 答案 C 解析 回归直线必过样本点中心( x , y ),即(2.5,4) 4 面对竞争日益激烈的消费市场, 众多商家不断扩大自己的销售市场, 以降低生产成本 某 白酒酿造企业市场部对该企业 9 月份的产品销量 x(单位:千箱)与单位成本 y(单位:元)的资 料进行线性回归分析,结果如下: x 7 2, y 71, i1 6 x2i79, i1 6 xiyi1 481,则销量每增 加 1 000 箱,单位成本下降_元
14、 考点 线性回归分析 题点 线性回归方程的应用 答案 1.818 2 解析 由题意知,b 1 48167 271 796 7 2 2 1.818 2, a71(1.818 2)7 277.36, y 关与 x 的线性回归方程为 y1.818 2x77.36, 即销量每增加 1 千箱,单位成本下降 1.818 2 元 5已知 x,y 之间的一组数据如下表: x 0 1 2 3 y 1 3 5 7 (1)分别计算: x , y ,x1y1x2y2x3y3x4y4,x21x22x23x24; (2)已知变量 x 与 y 线性相关,求出线性回归方程 考点 线性回归方程 题点 求线性回归方程 解 (1) x 0123 4 1.5, y 1357 4 4, x1y1x2y2x3y3x4y40113253734, x21x22x23x240212223214. (2)b3441.54 1441.52 2, a y b x 421.51, 故线性回归方程为 y2x1. 回归分析的步骤 (1)确定研究对象,明确哪个变量是自变量,哪个变量是因变量; (2)画出确定好的因变量关于自变量的散点图, 观察它们之间的关系(如是否存在线性关系等); (3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程 ybxa); (4)按一定规则估计回归方程中的参数