《回归分析的基本思想及其初步应用》人教版高中数学选修2-3PPT课件(第3.1课时)

上传人:邂*** 文档编号:176142 上传时间:2021-04-01 格式:PPTX 页数:33 大小:844.06KB
下载 相关 举报
《回归分析的基本思想及其初步应用》人教版高中数学选修2-3PPT课件(第3.1课时)_第1页
第1页 / 共33页
《回归分析的基本思想及其初步应用》人教版高中数学选修2-3PPT课件(第3.1课时)_第2页
第2页 / 共33页
《回归分析的基本思想及其初步应用》人教版高中数学选修2-3PPT课件(第3.1课时)_第3页
第3页 / 共33页
《回归分析的基本思想及其初步应用》人教版高中数学选修2-3PPT课件(第3.1课时)_第4页
第4页 / 共33页
《回归分析的基本思想及其初步应用》人教版高中数学选修2-3PPT课件(第3.1课时)_第5页
第5页 / 共33页
点击查看更多>>
资源描述

1、讲解人: 时间:2020.6.1 P E O P L E S E D U C A T I O N P R E S S H I G H S C H O O L M A T H E M A T I C S E L E C T I V E 2 - 3 3.1回归分析的基本思想及其初步应用回归分析的基本思想及其初步应用 第3章 统计案例 人 教 版 高 中 数 学 选 修 2 - 3 在数学3中,我们对两个具有线性相关关系的变量利用回归分析的方法进行了研究,其步骤为: 画散点图 求回归直线方程 用直线方程进行预报 课前导入 函数关系是一种确定性关系,而相关关系是一种非确定性关系.那么,这节课我们就学习

2、对具有相关 关系的两个变量进行统计分析的一种常用方法回归分析. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者 之间是否有关? 课前导入 探究 对于一组具有线性相关关系的数据 (x1,y1),(x2,y2),(xn,yn), 我们知道回归直线y=bx+a的斜率和截距的最小二乘估计分别为 n ii i=1 n 2 i i=1 (x - x)(y -y) b =, (x - x) a = y -bx, 新知探究 其中 nn ii i=1i=1 11 x =x ,y =y ,(x,y) nn 称为样本点的中心,你能推导出这两个计算公式吗? 回归直线过样本点的中

3、心 新知探究 从已经学过的知识我们知道,斜距 和斜率 分别是使 a b iiii Q(,)= y -y = y -(x +) 取最小时 的值.由于 , n 2 ii i=1 Q(,) =y -x -(y-x)+(y-x)- n 2 iiii i=1 2 y -x -(y-x) +2y -x -(y-x) (y-x)-+(y-x)- 新知探究 n ii i=1 n ii i=1 y -x -(y-x)(y-x-) =(y-x-)y -x -(y-x) 注注意意到到 nn ii i=1i=1 = (y-x-)y -x -n(y-x) = (y-x-)ny-nx-n(y-x)= 0, nn 2 ii

4、ii i=1i=1 2 =y -x -(y-x) +2y -x -(y-x)(y-x-) +n(y-x-) , 继续答题 新知探究 n 22 ii i=1 Q(,) =y -x -(y-x) +n(y-x-),因因此此 22 nnn 22 iiii i=1i=1i=1 =(x -x) -2(x -x)(y -y)+(y -y) +n(y-x-) 2 nn 2 2 iiiin 2 i=1i=1 i nn 22 i=1 ii i=1i=1 2 n i i=1 (x -x)(y -y)(x -x)(y -y) =n(y-x-) +(x -x)- (x -x)(x -x) +(y -y) n ii i

5、=1 n 2 i i=1 (x -x)(y -y) = (x -x) 这正是我们所要推导的公式. 在上式中,后两项和 无关,而前两项为非负数,因此要使Q取得最小值,当且仅当前两项 的值均为0,即有 , 新知探究 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示: 例题1 编 号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重. 新知探究 解答 第一步:画散点图 0 20 40

6、 60 80 150155160165170175180 身高/cm 体重/kg 新知探究 第二步:求回归方程 第三步:代值计算 计算器得: 故线性回归方程: 当x=172时, 0.849.b -85.712,a 85.712.-0.849xy y 0.849 172-85.712 60.316(kg) 新知探究 0 20 40 60 80 150155160165170175180 身高/cm 体重/kg 显然,身高172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重在60.316kg左右,下图 中的样本点和回归直线的相互位置说明了这一点. 探究 高为172c的女大学生

7、的体重一定是60.316kg吗?如果不是,其原因是什么? 新知探究 由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可用线性回 归模型 y=bx+a+e 来表示,这里a和b为模型的未知参数,e是y与bx+a之间的误差.通常e为随机变量,称为随机误 差.它的均值E(e)=0,方差D(e)= 20,这样线性回归的完整表达式为 y=bx+a+e E(e)=0, D(e)= 2. 新知探究 注意 存在误差的原因 (1)随机误差,其大小取决于随机误差的方差. 在线性回归模型中,随机误差e的方差 2越 小 ,用bx+a预报真实值y的精度越高. (2) 和 为斜率和截距的估计值,它

8、们与真实值a和b之间也存在误差. b a 要牢记! 新知探究 探究 在线性回归模型中,e是用bx+a预报真实值y的随机误差,它是一个不可观测的量,那么应该怎样 研究随机误差呢? 在实际应用中,我们用回归方程 a xb y 中的 估计bx+a. 由于随机误差e=y-(bx+a),所以 是e的估计值. 对于样本点 (x1,y1),(x2,y2),(xn,yn) y y -ye 新知探究 而言,它们的随机误差为ei=yi-bxi-a,i=1,2,n, 其估计值为 n,1,2,.,2,.,i,i a xb y y y e iiii i e 称为相应于点(xi,yi)的残差(residual). 要牢记

9、! 思考 如何发现数据中的错误?如何衡量模型的拟合效果? (1)可以利用残差图来分析残差特性; (2)可以利用. nn 22 iii 2i=1i=1 nn 22 ii i=1i=1 (y -y )(y -y) R= 1-= (y -y)(y -y) 来刻画回归的效果. 何为残差图? 新知探究 残差图 作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样 作出的图形称为残差图. 0 编号 1 2 3 4 5 6 7 10 20 30 40 50 60 70 80 -10 -20 -30 -40 -50 -60 90 100 要牢记! 新知探究 对R2的理解 (1)在含有

10、一个解释变量的线性模型中, R2恰好等于相关系数r的平方. (2)对于已经获取的样本数据, R2表达式中的 为确定的数. 因此R2越大,意味着残差平方和 越小,即模型的拟合效果越好;反之,越差. n 1i 2 i )y-(y n 1i 2 i )y-(y 要牢记! 新知探究 用身高预报体重时,需要注意以下问题 (1)回归方程只适用于我们所研究的样本总体; (2)我们所建立的回归方程一般都有时间性; (3)样本取值的范围会影响回归方程的适用范围; (4)不能期望回归方程得到的预报值就是预报变量的精确值. 新知探究 建立回归模型的基本步骤: (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预

11、报变量; (2)画出解释变量和预报变量的散点图,观察它们之间的关系; (3)由经验确定回归方程的类型; (4)按一定规则估计回归方程中的参数; (5)得出结果后分析残差图是否有异常,若有异常,检查数据是否有误,或模型是否合适等. 要牢记! 新知探究 为了对x、Y两个变量进行统计分析,现有以下两种线性模型 和 试 比较哪一个模型拟合的效果更好. 例题2 关于X与Y有如下数据: x 2 4 5 6 8 y 30 40 60 50 70 y = 6.5x+17.5 y = 7x+17 新知探究 分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两 种模型下的相关指数,然

12、后再进行比较,从而得出结论. 5 2 ii 2 i=1 15 2 i i=1 (y -y ) 155 R =1-=1-= 0.845 1000 (y -y) 2 2 R =1- 5 2 ii i=1 5 2 i i=1 (y -y ) 180 =1-= 0.82 1000 (y -y) 84.5%82%,所以甲选用的模型拟合效果较好. 解答 新知探究 1. 某校有学生2000人,其中高三学生500人,为了了解学生身体素质情况,采用按年级分层抽 样的方法,从该学生中抽取一个200人的样本,则样本中高三学生的人数为_. 解析:本题考查抽样的方法. 由已知抽样比200/2000=1/10,故样本中高

13、三学生数为500*(1/10)=50. 课堂练习 2.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y (吨标准煤)的几组对照数据. x 3 4 5 6 y 2.5 3 4 4.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 y = bx+a . 课堂练习 (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试根据(2)求出的线性回归方程,预测生 产100吨甲产品的生产能耗比技改前降低多少吨标准煤? 解析: (1)如下图 0 1 2 3 4 5 6 7 012345 产量 能耗 课堂练习 66.5

14、4.5645342.53(2) y x i n 1i i 4.5 4 6543 x 3.5 4 4.5432.5 y 866543 i 2222 n 1i 2 x 2 66.5-4 4.5 3.566.5-63 b = 0.7 86-4 4.586-81 a=Y-bX=3.5-0.7 4.5=0.35 故线性回归方程为y=0.7x+0.35. (3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7100+0.35=70.35. 课堂练习 1.选择 (1)下列说法中正确的有:( ) 若r0,则x增大时,y也相应增大; 若r0,则x增大时,y也相应增大; 若r=1或r=-1,则x

15、与y的关系完全对应(由函数关系),在散点图上各个点均在一条直线上 A. B. C. D. C 课堂练习 (2)对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效 果最好的模型是( ) A.模型的相关系数r为0.98 B.模型的相关系数r为0.80 C.模型的相关系数r为0.50 D.模型的相关系数r为0.25 A 课堂练习 (3)对有线性相关关系的两个变量建立的回归直线方程 中,回归系数 ( ) A.可以小于0 B.小于0 C.能等于0 D.只能等于0 axby b A 课堂练习 2.解答题 (1)现随机抽取了我校10名学生在入学考试中的数学成绩(x)与入学后的

16、第一次考试中的数学 成绩(y),数据如下: 学生号 1 2 3 4 5 6 7 8 9 10 x 120 108 117 104 103 110 104 105 99 108 y 84 64 84 68 69 68 69 46 57 71 试问这10个学生的两次数学考试成绩是否具有显著性线性相关关系? 课堂练习 查表得自由度为10-2=8相应的相关关系临界值 由 知,两次数学考 试成绩有显著性的线性相关关系. 10 1i 2 i 116584x 10 1i 2 i 47384y 107.8x 68y 73796yx 10 1i ii 易得 则相关系数为 解答 22 73796 10 107.8

17、 68 r0.7506 (116584 10 107.8 )(47384 10 68 ) 0.05 r0.6021 0.05 rr 课堂练习 1.数学知识 (1)建立回归模型及残差图分析的基本步骤; (2)不同模型拟合效果的比较方法; (3)相关指数和残差的分析. 2. 数学思想 数形结合的思想,化归思想及整体思想. 3.数学方法 数形结合法,转化法,换元法. 课堂小结 讲解人: 时间:2020.6.1 P E O P L E S E D U C A T I O N P R E S S H I G H S C H O O L M A T H E M A T I C S E L E C T I V E 2 - 3 感 谢 你 的 聆 听感 谢 你 的 聆 听 第3章 统计案例 人 教 版 高 中 数 学 选 修 2 - 3

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 高中 > 高中数学 > 人教新课标A版 > 选修2-3