ImageVerifierCode 换一换
格式:DOCX , 页数:9 ,大小:194.17KB ,
资源ID:194720      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,更优惠
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.77wenku.com/d-194720.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(2022届高三统考数学(文科)人教版一轮复习学案:11.5 变量间的相关关系与统计案例)为本站会员(Jc)主动上传,七七文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知七七文库(发送邮件至373788568@qq.com或直接QQ联系客服),我们立即给予删除!

2022届高三统考数学(文科)人教版一轮复习学案:11.5 变量间的相关关系与统计案例

1、第五节第五节 变量间的相关关系与统计案例变量间的相关关系与统计案例 【知识重温】【知识重温】 一、必记 4 个知识点 1两个变量的线性相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们 将它称为正相关 (2)负相关 在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关 (3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在_附近,就称这两个变量之间具有 线性相关关系,这条直线叫做回归直线 2回归方程 (1)最小二乘法 求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法 (2)回归方程 方程y

2、bxa是两个具有线性相关关系的变量的一组数据(x 1,y1),(x2,y2),(xn,yn) 的回归方程,其中a ,b是待定参数 b n i1 xi x yi y n i1 xi x 2 n i1xiyin x y n i1x 2 in x 2 , a y b x . 3回归分析 (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法 (2)样本点的中心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn)中_称为 样本点的中心 (3)相关系数 当 r0 时,表明两个变量_; 当 r0 时,表明两个变量_. r 的绝对值越接近于 1,表明两个变量的线性相关性_.

3、 r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关关系通常|r|大于 _时,认为两个变量有很强的线性相关性 4独立性检验 (1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量 (2)列联表:列出两个分类变量的频数表,称为列联表假设有两个分类变量 X 和 Y,它 们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为 22 列联表)为: y1 y2 总计 x1 a b ab x2 c d cd 总计 ac bd abcd 构造一个随机变量 K2 nadbc2 abcdacbd,其中 nabcd 为样本容量 (3)独立性检验 利用随机变量 K2来判断

4、“两个分类变量有关系”的方法称为独立性检验 二、必明 4 个易误点 1回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线 性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义 2根据回归方程进行预报,仅是一个预报值,而不是真实发生的值 3r 的大小只说明是否相关,并不能说明拟合效果的好坏,R2才是判断拟合效果好坏的 依据,必须将二者区分开来 4独立性检验的随机变量 K22.706 是判断是否有关系的临界值,K22.706 应判断为没 有充分依据显示 X 与 Y 有关系,而不能作为小于 90%的量化值来作出判断 【小题热身】【小题热身】 一、判断正误 1

5、判断下列说法是否正确(请在括号中打“”或“”) (1)散点图是判断两个变量是否相关的一种重要方法和手段( ) (2)回归直线方程y bxa至少经过点(x 1,y1),(x2,y2),(xn,yn)中的一个点( ) (3)若事件 X,Y 关系越密切,则由观测数据计算得到的 K2的观测值越小( ) (4)两个变量的相关系数的绝对值越接近于 1,它们的相关性越强( ) 二、教材改编 2下面是 22 列联表: y1 y2 总计 x1 a 21 73 x2 22 25 47 总计 b 46 120 则表中 a,b 的值分别为( ) A94,72 B52,50 C52,74 D74,52 3 某车间为了规

6、定工时定额, 需要确定加工零件所花费的时间, 为此进行了 5 次试验 根 据收集到的数据(如下表),由最小二乘法求得回归方程y 0.67x54.9. 零件数 x (个) 10 20 30 40 50 加工时间 y (min) 62 75 81 89 现发现表中有一个数据看不清,请你推断出该数据的值为_ 三、易错易混 4某医疗机构通过抽样调查(样本容量 n1 000),利用 22 列联表和 K2统计量研究患 肺病是否与吸烟有关计算得 K24.453,经查阅临界值表知 P(K23.841)0.05,现给出四 个结论,其中正确的是( ) A在 100 个吸烟的人中约有 95 个人患肺病 B若某人吸烟

7、,那么他有 95%的可能性患肺病 C有 95%的把握认为“患肺病与吸烟有关” D只有 5%的把握认为“患肺病与吸烟有关” 5恩格尔系数是食品支出总额占个人消费支出总额的比重,恩格尔系数越小,消费结构 越完善,生活水平越高某学校社会调查小组得到如下数据: 年个人消费支 出总额 x/万元 1 1.5 2 2.5 3 恩格尔系数 y 0.9 0.8 0.5 0.2 0.1 若 y 与 x 之间有线性相关关系,老张年个人消费支出总额为 2.8 万元,据此估计其恩格尔 系数为_ 参考数据: i1 5 xiyi5 x y1.1, i1 5 x2i5 x 22.5. 参考公式:对于一组数据(x1,y1),(

8、x2,y2),(xn,yn),其回归直线y bxa的斜率和 截距的最小二乘估计分别为b i1 n xiyin x y i1 n x2in x 2 ,a yb x . 四、走进高考 6 2020 全国卷某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位: ) 的关系,在 20 个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i1,2,20)得 到下面的散点图: 由此散点图, 在 10 至 40 之间, 下面四个回归方程类型中最适宜作为发芽率 y 和温度 x 的回归方程类型的是( ) Ayabx Byabx2 Cyabex Dyabln x 考点一 相关关系的判断自主练透型

9、 1 已知变量 x 和 y 满足关系 y0.1x1, 变量 y 与 z 正相关 下列结论中正确的是( ) Ax 与 y 正相关,x 与 z 负相关 Bx 与 y 正相关,x 与 z 正相关 Cx 与 y 负相关,x 与 z 负相关 Dx 与 y 负相关,x 与 z 正相关 22021 云南昆明诊断某商家今年上半年各月的人均销售额(单位:千元)与利润率统计 表如下: 月份 1 2 3 4 5 6 人均销售额 6 5 8 3 4 7 利润率(%) 12.6 10.4 18.5 3.0 8.1 16.3 根据表中数据,下列说法正确的是( ) A利润率与人均销售额成正相关关系 B利润率与人均销售额成负

10、相关关系 C利润率与人均销售额成正比例函数关系 D利润率与人均销售额成反比例函数关系 悟 技法 判定两个变量正、负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下 角,两个变量负相关 (2)相关系数:r0 时,正相关;r0 时,负相关 (3)线性回归方程中:b 0 时,正相关;b0 时,负相关. 考点二 线性回归方程互动讲练型 例 1 2020 全国卷某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有 所增加为调查该地区某种野生动物的数量,将其分成面积相近的 200 个地块,从这些地块 中用简单随机抽样的方法抽取 20 个作为样区,调查得到样

11、本数据(xi,yi)(i1,2,20),其 中 xi和 yi分别表示第 i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得 i1 20 xi60, i1 20 yi1 200, i1 20 (xi x )280, i1 20 (yi y )29 000, i1 20 (xi x )(y i y )800. (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生 动物数量的平均数乘以地块数); (2)求样本(xi,yi)(i1,2,20)的相关系数(精确到 0.01); (3)根据现有统计资料,各地块间植物覆盖面积差异很大为提高样本的代表性以获得该 地

12、区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由 附:相关系数 r i1 n xi x y i y i1 n xi x 2 i1 n yi y 2 , 21.414. 悟 技法 求线性回归方程的基本步骤 (1)先把数据制成表,从表中计算出 x 、 y,x2 1x 2 2x 2 n、x1y1x2y2xnyn的值 (2)计算回归系数a ,b. (3)写出线性回归方程y bxa. 注:回归方程一定过点( x , y). 变式练(着眼于举一反三) 12021 大同市高三学情调研测试试题下表提供了某厂节能降耗技术改造后生产甲产品 过程中记录的产量 x(单位:吨)与相应的生产能

13、耗 y(单位:吨标准煤)的几组对照数据 x 3 4 5 6 y 2.5 3 4 4.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法,求出 y 关于 x 的线性回归方程y bxa; (3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤, 试根据(2)求出的线性回归方 程预测生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤 参考数据及公式:32.5435464.566.5, b i1 n xi x y i y i1 n xi x 2 i1 n xiyin x y i1 n x2in x 2 ,a yb x . 考点三 独立性检验互动讲练型 例 2

14、 2020 全国卷某学生兴趣小组随机调查了某市 100 天中每天的空气质量等级和 当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次 空气质量等级 0,200 (200,400 (400,600 1(优) 2 16 25 2(良) 5 10 12 3(轻度污染) 6 7 8 4(中度污染) 7 2 0 (1)分别估计该市一天的空气质量等级为 1,2,3,4 的概率; (2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为 代表); (3)若某天的空气质量等级为 1 或 2, 则称这天“空气质量好”; 若某天的空气质量等级为 3 或 4,则称这天“空气质量

15、不好”根据所给数据,完成下面的 22 列联表,并根据列联 表,判断是否有 95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关 人次400 人次400 空气质量好 空气质量不好 附:K2 nadbc2 abcdacbd, P(K2k) 0.050 0.010 0.001 k 3.841 6.635 10.828 悟 技法 解独立性检验的应用问题的关注点 (1)两个明确: 明确两类主体; 明确研究的两个问题 (2)两个关键: 准确画出 22 列联表; 准确理解 K2. 提醒:准确计算 K2的值是正确判断的前提. 变式练(着眼于举一反三) 22021 惠州市高三调研考试试题某品牌汽车

16、4S 店,对该品牌旗下的 A 型、B 型、C 型汽车进行维修保养, 汽车 4S 店记录了 100 辆该品牌三种类型汽车的维修情况, 整理得下表: 车型 A 型 B 型 C 型 频数 20 40 40 假设该店采用分层抽样的方法从上述维修的 100 辆该品牌三种类型汽车中随机取 10 辆进 行问卷回访 (1)分别求抽取 A 型、B 型、C 型汽车的问卷数量 (2)维修结束后这 100 辆汽车的司机采用“100 分制”打分的方式表示对 4S 店的满意度, 按照大于等于 80 分为优秀,小于 80 分为合格,得到如下列联表: 优秀 合格 合计 男司机 10 38 48 女司机 25 27 52 合计

17、 35 65 100 问能否在犯错误的概率不超过0.01的前提下认为司机对4S店的满意度与性别有关系?请 说明原因. 参考公式:K2 nadbc2 abcdacbd 附表: P(K2k) 0.100 0.050 0.010 0.001 k 2.706 3.841 6.635 10.828 第五节第五节 变量间的相关关系与统计案例变量间的相关关系与统计案例 【知识重温】【知识重温】 一条直线 ( x , y ) 正相关 负相关 越强 0.75 【小题热身】【小题热身】 1答案:(1) (2) (3) (4) 2解析:a2173,a52.又 a22b,b74. 答案:C 3解析:由 x 30,得

18、y0.673054.975.设表中的“模糊数字”为 a,则 62a 758189755,a68. 答案:68 4解析:由已知数据可得,有 10.0595%的把握认为“患肺病与吸烟有关” 答案:C 5解析:b 1.1 2.5 0.44, y 0.5, x2,故a yb x 0.5(0.44)21.38, 则y 0.44x1.38,所以老张的恩格尔系数为0.442.81.380.148. 答案:0.148 6解析:观察散点图可知,散点图用光滑曲线连接起来比较接近对数型函数的图象故 选 D. 答案:D 课堂考点突破课堂考点突破 考点一 1解析:因为 y0.1x1 的斜率小于 0,故 x 与 y 负相

19、关因为 y 与 z 正相关,可设 z b ya,b0,则 zbya0.1bxba,故 x 与 z 负相关 答案:C 2解析:画出利润率与人均销售额的散点图,如图由图可知利润率与人均销售额成正 相关关系故选 A. 答案:A 考点二 例 1 解析:(1)由已知得样本平均数 y 1 20 i1 20 yi60,从而该地区这种野生动物数量的估 计值为 6020012 000. (2)样本(xi,yi),(i1,2,20)的相关系数 r i1 20 xi x y i y i1 20 xi x 2 i1 20 yi y 2 800 809 000 2 2 3 0.94. (3)分层抽样:根据植物覆盖面积的

20、大小对地块分层,再对 200 个地块进行分层抽样 理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关由于各 地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样 的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性从而可以获得该 地区这种野生动物数量更准确的估计 变式练 1解析:(1)由题设所给数据,可得散点图如图 (2)由对照数据计算得 x 3456 4 4.5, y 2.5344.5 4 3.5, i1 4 x2i86, i1 4 xiyi66.5, b i1 4 xiyi4 x y i1 4 x2i4 x 2 66.544.5

21、3.5 8644.52 0.7, a yb x 3.50.74.50.35, y 0.7x0.35. (3)由(2)得到的线性回归方程,可预测生产 100 吨甲产品的生产能耗,比技改前降低 90 (0.71000.35)19.65(吨标准煤) 考点三 例 2 解析:(1)由所给数据,该市一天的空气质量等级为 1,2,3,4 的概率的估计值如下表 空气质量等级 1 2 3 4 概率的估计值 0.43 0.27 0.21 0.09 (2)一天中到该公园锻炼的平均人次的估计值为 1 100(100203003550045) 350. (3)根据所给数据,可得 22 列联表: 人次400 人次400 空气质量好 33 37 空气质量不好 22 8 根据列联表得 K21003382237 2 55457030 5.820. 由于 5.8203.841,故有 95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质 量有关 变式练 2解析:(1)抽取 A 型、B 型、C 型汽车的问卷数量分别为 20 100102, 40 100104, 40 100 104. (2)根据题意得,K210010273825 2 48523565 8.143 1. 因为 8.143 16.635, 所以能在犯错误的概率不超过 0.01 的前提下,认为司机对 4S 店的满意度与性别有关系