2022届高考北师大版数学(理)一轮复习学案:10.4 变量间的相关关系与统计案例

上传人:Jc 文档编号:194793 上传时间:2021-10-06 格式:DOC 页数:15 大小:646.50KB
下载 相关 举报
2022届高考北师大版数学(理)一轮复习学案:10.4 变量间的相关关系与统计案例_第1页
第1页 / 共15页
2022届高考北师大版数学(理)一轮复习学案:10.4 变量间的相关关系与统计案例_第2页
第2页 / 共15页
2022届高考北师大版数学(理)一轮复习学案:10.4 变量间的相关关系与统计案例_第3页
第3页 / 共15页
2022届高考北师大版数学(理)一轮复习学案:10.4 变量间的相关关系与统计案例_第4页
第4页 / 共15页
2022届高考北师大版数学(理)一轮复习学案:10.4 变量间的相关关系与统计案例_第5页
第5页 / 共15页
点击查看更多>>
资源描述

1、第四节 变量间的相关关系与统计案例 命题分析预测 学科核心素养 对于回归分析,高考考查较多,主要考查求 线性回归方程、利用回归方程进行预测,一 般以解答题的形式出现,难度中等,有时也 会以小题的形式考查变量的相关性;对于独 立性检验,一般以解答题的第一问进行考查, 常与概率知识相交汇命题 本节通过回归分析、独立性检验考查考生分 析解决问题的能力,提升数学运算、直观想 象、数据分析、逻辑推理、数学建模等核心 素养 授课提示:对应学生用书第 245 页 知识点一 变量间的相关关系 1变量间的相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不 同,相关关系是

2、一种非确定性关系 (2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正 相关,点散布在左上角到右下角的区域内,两个变量的相关关系为负相关 2两个变量的线性相关 (1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称 两个变量之间具有线性相关关系,这条直线叫做回归直线 (2)回归方程为 ybxa,其中 b n i1xiyinx y n i1x 2 inx 2 , ay bx (3)通过求 Q n i1 (yibxia) 2的最小值而得到回归直线的方法,即使得样本数据的点到 回归直线的距离的平方和最小,这一方法叫做最小二乘法 (4)相关系数

3、:当 r0 时,表明两个变量正相关;当 r0,则正相关;r0 时,正相关;b0 时,负相关 题型二 回归分析 例 (2021 福州市模拟)随着我国中医学的发展,药用昆虫的使用相应愈来愈多每年春 暖以后至寒冬前,昆虫大量活动与繁殖,易于采集各种药用昆虫已知一只药用昆虫的产卵 数 y(单位:个)与一定范围内的温度 x(单位:)有关,于是科研人员在 3 月份的 31 天中 随机挑选了 5 天进行研究,现收集了该种药用昆虫的 5 组观测数据如下表: 日期 2 日 7 日 15 日 22 日 30 日 温度 x/ 10 11 13 12 8 产卵数 y/个 23 25 30 26 16 (1)从这 5

4、天中任选 2 天,记这 2 天药用昆虫的产卵数分别为 m,n,求事件“m,n 均不小 于 25”的概率; (2)科研人员确定的研究方案是:先从这 5 组数据中任选 2 组,用剩下的 3 组数据建立 y 关 于 x 的线性回归方程,再对被选取的 2 组数据进行检验 若选取的是 3 月 2 日与 30 日这 2 组的数据,请根据 3 月 7 日、15 日和 22 日这 3 组的数据, 求出 y 关于 x 的线性回归方程; 若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 2 个,则认为得到 的线性回归方程是可靠的,试问中所得的线性回归方程是否可靠? 附: 回归直线的斜率和截距的最小二

5、乘估计公式分别为 b n i1 (xix )(yiy ) n i1 (xix )2 , ay bx 解析 (1)依题意得,m,n 的所有情况有23,25,23,30,23,26,23,16,25, 30,25,26,25,16,30,26,30,16,26,16,共 10 个设“m,n 均不小于 25”为事件 A,则事件 A 包含的所有情况有25,30,25,26,30,26,共 3 个,所以 P (A) 3 10,故事件“m,n 均不小于 25”的概率为 3 10 (2)由已知数据得x 12,y 27, 3 i1 (xix ) (yiy )5, 3 i1 (xix )22,所以 b 3 i1

6、 (xix )(yiy ) 3 i1 (xix )2 5 2,ay 5 2x 275 2123所以 y 关于 x 的线性回归方程为 y 5 2x3 由知,y 关于 x 的线性回归方程为 y5 2x3当 x10 时,y 5 210322,|2223| 2,当 x8 时,y5 28317,|1716|2所以中所得的线性回归方程 y 5 2x3 是可 靠的 1回归直线方程中系数的两种求法 (1)公式法:利用公式,求出回归系数 b,a (2)待定系数法:利用回归直线过样本点中心(x ,y )求系数 2回归分析的两种策略 (1)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值 (2)利用回归直

7、线判断正、负相关:决定正相关还是负相关的是回归系数 b 对点训练 随着我国经济的发展,居民的储蓄存款逐年增长设某地区城乡居民人民币储蓄存款(年底 余额)如下表: 年份 2016 2017 2018 2019 2020 时间代号 t 1 2 3 4 5 储蓄存款 y(千亿元) 5 6 7 8 10 (1)求 y 关于 t 的回归方程 ybta; (2)用所求回归方程预测该地区 2021 年(t6)的人民币储蓄存款 附:回归方程 ybta 中,b n i1tiyint y n i1t 2 int 2 ,ay bt 解析: (1)列表计算如下: i ti yi t2i tiyi 1 2 3 4 5

8、1 2 3 4 5 5 6 7 8 10 1 4 9 16 25 5 12 21 32 50 15 36 55 120 这里 n5,t 1 n n i1ti 15 5 3,y 1 n n i1yi 36 5 72 又 n i1t 2 int 25553210, n i1tiyint y 120537212, 从而 b12 1012,ay bt 7212336, 故所求回归方程为 y12t36 (2) 将 t6 代入回归方程可预测该地区 2021 年的人民币储蓄存款为 y1 263 610 8 (千亿元) 题型三 独立性检验 例 (2021 洛阳市统考)某共享单车经营企业欲向甲市投放单车,为制定

9、适宜的经营策略, 该企业首先在已投放单车的乙市进行单车使用情况调查调查过程分随机问卷、整理分析及 开座谈会三个阶段在随机问卷阶段,A,B 两个调查小组分赴全市不同区域发放问卷并及时 收回;在整理分析阶段,两个调查小组从所获取的有效问卷中,针对 15 至 45 岁的人群,按 比例随机抽取了 300 份,进行数据统计,具体情况如下表: 组别 年龄 A 组统计结果 B 组统计结果 经常使用单车 偶尔使 用单车 经常使 用单车 偶尔使 用单车 15,25) 27 人 13 人 40 人 20 人 25,35) 23 人 17 人 35 人 25 人 35,45 20 人 20 人 35 人 25 人

10、(1)先用分层抽样的方法从上述 300 人中按“年龄是否达到 35 岁”抽出一个容量为 60 人的 样本,再用分层抽样的方法将“年龄达到 35 岁”的被抽个体分配到“经常使用单车”和“偶 尔使用单车”中去, 求这 60 人中“年龄达到 35 岁且偶尔使用单车”的人数; 为听取对发展共享单车的建议,调查小组专门组织所抽取的“年龄达到 35 岁且偶尔使用单 车”的人员召开座谈会会后共有 3 份礼品赠送给其中 3 人,每人 1 份(其余人员仅赠送骑 行优惠券) 已知参加座谈会的人员中有且只有 4 人来自 A 组,求 A 组这 4 人中得到礼品的人 数 X 的分布列和数学期望 (2)从统计数据可直观得

11、出“经常使用共享单车与年龄达到 m 岁有关”的结论在用独立性 检验的方法说明该结论成立时, 为使犯错误的概率尽可能小, 年龄 m 应取 25 还是 35?请通过 比较 2的大小加以说明 参考公式:2 n(adbc)2 (ab)(cd)(ac)(bd),其中 nabcd 解析 (1)从 300 人中抽取 60 人,其中“年龄达到 35 岁”的人数为 100 60 30020,再 将这 20 人用分层抽样法按“是否经常使用单车”进行名额划分,其中“年龄达到 35 岁且偶 尔使用单车”的人数为 20 45 1009 A 组这 4 人中得到礼品的人数 X 的可能取值为 0, 1,2, 3,相应概率为

12、P (X0)C 3 5 C39 5 42, P(X1)C 1 4C 2 5 C39 10 21,P(X2) C24C15 C39 5 14,P(X3) C34 C39 1 21 故其分布列为 X 0 1 2 3 P 5 42 10 21 5 14 1 21 所以 EX0 5 421 10 212 5 143 1 21 4 3 (2)按“年龄是否达到 35 岁”对数据进行整理,得到如下列联表: 经常使用单车 偶尔使用单车 合计 未达到 35 岁 125 75 200 达到 35 岁 55 45 100 合计 180 120 300 m35 时,可求得 21300(125457555) 2 200

13、100180120 3001 5002 200100180120 25 16 按“年龄是否达到 25 岁”对数据进行整理,得到如下列联表: 经常使用单车 偶尔使用单车 合计 未达到 25 岁 67 33 100 达到 25 岁 113 87 200 合计 180 120 300 m25 时,可求得 22300(678733113) 2 100200180120 3002 1002 100200180120 49 16 所以 2221 欲使犯错误的概率尽可能小,需取 m25 1在 22 列联表中,如果两个变量没有关系,则应满足 adbc0|adbc|越小,说明两 个变量之间关系越弱;|adbc|

14、越大,说明两个变量之间关系越强 2解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论独立性检验的一般 步骤: (1)根据样本数据制成 22 列联表 (2)根据公式 2 n(adbc)2 (ab)(ac)(bd)(cd)计算 2 (3)比较 2与临界值的大小关系,作统计推断 对点训练 3(2021 惠州调研)在某校举行的航天知识竞赛中,参与竞赛的文科生与理科生人数之比为 13,且成绩分布在40,100,分数在 80 以上(含 80)的同学获奖按文理科用分层抽样的 方法抽取 200 人的成绩作为样本,得到成绩的频率分布直方图如下 (1) 求 a 的值, 并计算所抽取样本的平均值x (同一

15、组中的数据用该组区间的中点值作代表) ; (2)填写下面的 22 列联表,是否有超过 95%的把握认为“获奖与学生的文理科有关”? 文科生 理科生 合计 获奖 5 不获奖 合计 200 附表及公式: 2 n(adbc)2 (ab)(cd)(ac)(bd),其中 nabcd P(2k) 015 010 005 0025 0010 0005 0001 k 2072 2706 3841 5024 6635 7879 10828 解析:(1) 由频率分布直方图, 可得 a1 (0 010 0150 030 0150 005) 10 10 0025, x 450155015650257503850159

16、500569 (2)填写 22 列联表如下: 文科生 理科生 合计 获奖 5 35 40 不获奖 45 115 160 合计 50 150 200 则 2200(51153545) 2 5015040160 25 6 41673841,有超过 95%的把握认为“获奖与 学生的文理科有关” 非线性回归问题中的核心素养 数学建模、数学运算非线性回归的应用问题 例 为了研究一种昆虫的产卵数 y(单位:个)和温度 x(单位:)是否有关,现收集了 7 组观测数据列于下表中,并作出了如图所示的散点图,发现样本点没有分布在某个带状区域 内,两个变量不呈线性相关关系,现分别用模型:yC1x2C2与模型:yeC

17、3xC4作为 产卵数 y 和温度 x 的回归方程来建立两个变量之间的关系 温度 x/ 20 22 24 26 28 30 32 产卵数 y/个 6 10 21 24 64 113 322 tx2 400 484 576 676 784 900 1 024 zln y 179 230 304 318 416 473 577 x t y z 26 692 80 357 1 15754 043 032 0000 12 其中 tix2i,t 1 7 7 i1ti,ziln yi,z 1 7 7 i1zi (1)分别在下图(1) (2)中画出 y 关于 t 的散点图和 z 关于 x 的散点图,根据散点图

18、判断哪 一个模型更适宜作为昆虫的产卵数 y 关于温度 x 的回归方程类型? (给出判断即可, 不必说明 理由) (1) (2) (2)根据表中数据,分别在两个模型下建立 y 关于 x 的回归方程,并在两个模型下分别估计 温度为 30 时的产卵数; (参考数据:e4 6510458,e48512774,e50515602) (3)若模型的相关指数分别为 R21082,R22096,请根据相关指数判断哪个模型的 拟合效果更好 附:对于一组数据(u1,v1) , (u2,v2) , (un,vn) ,其回归直线 vu 的斜率和截距 的最小二乘估计分别为 n i1 (uiu )(viv ) n i1

19、(uiu )2 ,v u 解析: (1)画出 y 关于 t 的散点图,如图所示 画出 z 关于 x 的散点图,如图所示 根据散点图可以判断模型更适宜作为昆虫的产卵数 y 关于温度 x 的回归方程类型 (2)对于模型,因为 tx2,所以 yC1x2C2C1tC2, 所以 C1 7 i1 (tit )(yiy ) 7 i1 (tit )2 043,C2y C1t 8004369221756, 故所求回归方程为 y043x221756, 当 x30 时,y0433022175616944, 故估计温度为 30 时的产卵数为 169 个; 对于模型,因为 yeC3xC4,所以 zln yC3xC4,

20、所以 C3 7 i1 (ziz )(xix ) 7 i1 (xix )2 032,C4z C3x 35703226475, 故所求回归方程为 ye0 32x475, 当 x30 时,ye0 323047512774, 故估计温度为 30 时的产卵数为 128 个 (3)因为 R21082,R22096,R21R22,所以模型的拟合效果更好 非线性回归方程的求法 (1)根据原始数据作出散点图; (2)根据散点图,选择恰当的拟合函数; (3)作恰当变换,将其转化成线性函数,求线性回归方程; (4)在(3)的基础上通过相应变换,即可得非线性回归方程 对点训练 (2021 汕头模拟)二手车经销商小王对

21、其所经营的 A 型号二手汽车的使用年数 x 与销售价 格 y(单位:万元/辆)进行整理,得到如下数据: 使用年数 x 2 3 4 5 6 7 售价 y 20 12 8 64 44 3 zln y 300 248 208 186 148 110 下面是 z 关于 x 的折线图: (1)由折线图可以看出,可以用线性回归模型拟合 z 与 x 的关系,请用相关系数加以说明; (2)求 y 关于 x 的回归方程,并预测某辆 A 型号二手车当使用年数为 9 年时售价约为多少; (b、a 小数点后保留两位有效数字) (3)基于成本的考虑,该型号二手车的售价不得低于 7 118 元,请根据(2)求出的回归方程

22、 预测在收购该型号二手车时车辆的使用年数不得超过多少年 参 考 公 式 : b n i1 (xix )(yiy ) n i1 (xix )2 n i1xiyinx y n i1x 2 inx 2 , a y b x , r n i1 (xix )(yiy ) n i1 (xix )2 n i1 (yiy )2 参考数据: 6 i1xiyi1874, 6 i1xizi4764, 6 i1x 2 i139, 6 i1 (xix )2418, 6 i1 (yiy )21396, 6 i1 (ziz )2153,ln 146038,ln 0711 8 034 解析: (1)由题意,知x 1 6(234

23、567)45, z 1 6(3248208186148110)2, 又 6 i1xizi4764, 6 i1 (xix )2418, 6 i1 (ziz )2153, r47.6464.52 4.181.53 6.36 6.395 4099, z 与 x 的相关系数大约为099,说明 z 与 x 的线性相关程度很高 (2)b47.6464.52 13964.52 6.36 17.5036, az bx 203645362, z 与 x 的线性回归方程是 z036x362,又 zln y, y 关于 x 的回归方程是 ye 036x362 令 x9, 得 ye 0369362e038,ln 146038, y146, 即预测某辆 A 型号二手车当使用年数为 9 年时售价约为 146 万元 (3)当y 0711 8, 即 e 036x3620711 8eln 0711 8e034 时, 则有036x362034,解得 x11, 因此,预测在收购该型号二手车时车辆的使用年数不得超过 11 年

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 高中 > 高中数学 > 数学高考 > 一轮复习