考点34 变量的相关关系与统计案例(学生版)备战2021年新高考数学微专题补充考点精练

上传人:hua****011 文档编号:162248 上传时间:2020-11-26 格式:DOC 页数:16 大小:1.13MB
下载 相关 举报
考点34 变量的相关关系与统计案例(学生版)备战2021年新高考数学微专题补充考点精练_第1页
第1页 / 共16页
考点34 变量的相关关系与统计案例(学生版)备战2021年新高考数学微专题补充考点精练_第2页
第2页 / 共16页
考点34 变量的相关关系与统计案例(学生版)备战2021年新高考数学微专题补充考点精练_第3页
第3页 / 共16页
考点34 变量的相关关系与统计案例(学生版)备战2021年新高考数学微专题补充考点精练_第4页
第4页 / 共16页
考点34 变量的相关关系与统计案例(学生版)备战2021年新高考数学微专题补充考点精练_第5页
第5页 / 共16页
点击查看更多>>
资源描述

1、 第 1 页 / 共 16 页 考点考点 34 变量的相关关系与统计案例变量的相关关系与统计案例 1、了解样本相关系数的统计含义, 2、了解样本相关系数与标准化数据向量夹角的关系,了解一元线性回归模型及独立性检验的含义, 3、了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,针对 实际问题,会用一元线性回归模型进行预测 独立性检验是一种统计案例,是高考命题的一个热点,多以解答题的形式出现,试题难度不大,多为 中档题,高考中经常是将独立性检验与概率统计相综合进行命题,解题关键是根据独立性检验的一般步骤, 作出判断,再根据概率统计的相关知识求解问题. 1、独立性

2、检验独立性检验 利用随机变量 2 K (也可表示为 2 ) 2 () ()()()() n adbc ab cd ac bd (其中nabcd 为样本容量)来判断 “两个变量有关系”的方法称为独立性检验 2、独立性检验的一般步骤独立性检验的一般步骤 (1)根据样本数据列出2 2列联表; (2)计算随机变量 2 K 的观测值 k,查下表确定临界值 k0: 2 0 ()P Kk 0.50 0.40 0.25 0.15 0.100 0.050 0.025 0.010 0.005 0.001 0 k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.8

3、79 10.828 考纲要求考纲要求 近三年高考情况分析近三年高考情况分析 考点总结考点总结 第 2 页 / 共 16 页 (3)如果 0 kk,就推断“X 与 Y 有关系”,这种推断犯错误的概率不超过 2 0 P Kk;否则,就认为 在犯错误的概率不超过 2 0 P Kk的前提下不能推断“X 与 Y 有关系” 【注意】(1)通常认为2.706k 时,样本数据就没有充分的证据显示“X 与 Y 有关系” (2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个 结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就 可能对统计

4、计算的结果作出错误的解释 (3)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断 (4)已知分类变量的数据,判断两类变量的相关性可依据数据及公式计算 2 K ,然后作出判断 3、相关关系相关关系 当自变量取值一定时, 因变量的取值带有一定的随机性, 则这两个变量之间的关系叫做相关关系 即 相关关系是一种非确定性关系 当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量正相关; 当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负相关. 【注意】相关关系与函数关系的异同点: 共同点:二者都是指两个变量间的关系 不同点:函数关系是一种确定性关系,体

5、现的是因果关系;而相关关系是一种非确定性关系,体现 的不一定是因果关系,可能是伴随关系 4、非线性回归方程及应用非线性回归方程及应用 求非线性回归方程的步骤: 1确定变量,作出散点图 2根据散点图,选择恰当的拟合函数 3变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程 4分析拟合效果:通过计算相关指数或画残差图来判断拟合效果 5根据相应的变换,写出非线性回归方程 三年高考真题三年高考真题 第 3 页 / 共 16 页 1、 【2020 年高考全国卷理数】某校一个课外学习小组为研究某作物种子的发芽率 y 和温度 x(单位: C) 的关系,在 20 个不同的温度条件下进

6、行种子发芽实验,由实验数据( , )(1,2,20) ii x yi 得到下面的散点 图: 由此散点图,在 10 C 至 40 C 之间,下面四个回归方程类型中最适宜作为发芽率 y 和温度 x 的回归方 程类型的是 Ay abx B 2 yabx Ce x yab D lnyabx 2、 【2020 年高考全国卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加为 调查该地区某种野生动物的数量,将其分成面积相近的 200 个地块,从这些地块中用简单随机抽样的 方法抽取 20 个作为样区,调查得到样本数据(xi,yi)(i=1,2,20),其中 xi和 yi分别表示第 i 个样

7、区 的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得 20 1 60 i i x , 20 1 1200 i i y , 20 2 1 )8(0 i i xx , 20 2 1 )9000( i i yy , 20 1 )()800( ii i yyxx (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的 平均数乘以地块数) ; (2)求样本(xi,yi) (i=1,2,20)的相关系数(精确到 0.01) ; (3)根据现有统计资料,各地块间植物覆盖面积差异很大为提高样本的代表性以获得该地区这种野 生动物数量更准确的估计,请给出一种你认为更合

8、理的抽样方法,并说明理由 附:相关系数 1 22 11 ) ( () () ( ) ii i n i n i i n i xy r xy xy xy , 21.414 第 4 页 / 共 16 页 3、 【2020 年高考全国 III 卷理数】某学生兴趣小组随机调查了某市 100 天中每天的空气质量等级和当天到某 公园锻炼的人次,整理数据得到下表(单位:天) : 锻炼人次 锻炼人次 空气质量等级 0,200 (200,400 (400,600 1(优) 2 16 25 2(良) 5 10 12 3(轻度污染) 6 7 8 4(中度污染) 7 2 0 (1)分别估计该市一天的空气质量等级为 1,

9、2,3,4 的概率; (2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表) ; (3)若某天的空气质量等级为 1 或 2,则称这天“空气质量好”;若某天的空气质量等级为 3 或 4,则称 这天“空气质量不好”根据所给数据,完成下面的 2 2 列联表,并根据列联表,判断是否有 95%的把 握认为一天中到该公园锻炼的人次与该市当天的空气质量有关? 人次400 人次400 空气质量好 空气质量不好 附:K2= 2 ) n adbc ab cdacbd , P(K2k) 0.050 0.010 0.001 k 3.841 6.635 10.828 4、 【2020 年

10、高考山东】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽 查了100天空气中的PM2.5和 2 SO浓度(单位: 3 g/m) ,得下表: 第 5 页 / 共 16 页 2 SO PM2.5 0,50 (50,150 (150,475 0,35 32 18 4 (35,75 6 8 12 (75,115 3 7 10 (1)估计事件“该市一天空气中PM2.5浓度不超过75,且 2 SO浓度不超过150”的概率; (2)根据所给数据,完成下面的22列联表: 2 SO PM2.5 0,150 (150,475 0,75 (75,115 (3) 根据 (2) 中的列联表,

11、判断是否有99%的把握认为该市一天空气中PM2.5浓度与 2 SO浓度有关? 附: 2 2 () ()()()() n adbc K ab cd ac bd , 2 ()P Kk 0.050 0.010 0.001 k 3.841 6.635 10.828 5、 【2018 年高考全国卷理数】下图是某地区 2000 年至 2016 年环境基础设施投资额y(单位:亿元)的 折线图 第 6 页 / 共 16 页 为了预测该地区 2018 年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型根据 2000 年至 2016 年的数据(时间变量t的值依次为1 2 17, ,)建立模型:30.4

12、 13.5yt ;根据 2010 年 至 2016 年的数据(时间变量t的值依次为1 2 7, ,)建立模型:99 17.5yt (1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由 6、 【2018 年高考全国卷理数】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的 两种新的生产方式为比较两种生产方式的效率,选取 40 名工人,将他们随机分成两组,每组 20 人第 第 7 页 / 共 16 页 一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位: min)绘制

13、了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求 40 名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表: 超过m 不超过m 第一种生产方式 第二种生产方式 (3)根据(2)中的列联表,能否有 99%的把握认为两种生产方式的效率有差异? 附: 2 2 n adbc K abcdacbd , 2 P Kk 0.050 0.010 0.001 k 3.841 6.635 10.828 二年模拟试题二年模拟试题 第 8 页 / 共 16 页 题型一、独立性检验与线性回归方程 1、 (2020 届山东省德州市高三

14、上期末)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关” 作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的 4 5 ,女生喜欢抖音的人 数占女生人数 3 5 ,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人 附表: 2 0 P Kk 0.050 0.010 k 3.841 6.635 附: 2 2 n adbc K abcdacbd A25 B45 C60 D75 2、 (2020 届山东省烟台市高三上期末)某大学为了解学生对学校食堂服务的满意度,随机调查了 50 名男生 和 50 名女生,每位学生对食堂的服务给出满意或不满意的评

15、价,得到如图所示的列联表.经计算 2 K 的观测 值4.762k ,则可以推断出( ) 满意 不满意 男 30 20 女 40 10 2 P Kk 0.100 0.050 0.010 k 2.706 3.841 6.635 A该学校男生对食堂服务满意的概率的估计值为 3 5 B调研结果显示,该学校男生比女生对食堂服务更满意 C有 95%的把握认为男、女生对该食堂服务的评价有差异 D有 99%的把握认为男、女生对该食堂服务的评价有差异 3、 (2020 届山东省德州市高三上期末) 某公司为了了解年研发资金投人量x(单位: 亿元) 对年销售额y(单 第 9 页 / 共 16 页 位:亿元)的影响.

16、对公司近12年的年研发资金投入量 i x和年销售额 i y的数据,进行了对比分析,建立了两 个函数模型: 2 yx, x t ye ,其中、t均为常数,e为自然对数的底数.并得到一 些统计量的值.令 2 ii ux,ln1,2,12 ii vy i,经计算得如下数据: x y 12 2 1 i i xx 12 2 1 i i yy u v 20 66 77 2 460 4.20 12 2 1 i i uu 12 1 ii i uuyy 12 2 1 i i vv 12 1 ii i xxvv 31250 215 3.08 14 (1)请从相关系数的角度,分析哪一个模型拟合程度更好? (2) (

17、)根据(1)的选择及表中数据,建立y关于x的回归方程; ()若下一年销售额y需达到90亿元,预测下一年的研发资金投入量x是多少亿元? 附:相关系数 1 22 11 n ii i nn ii ii xxyy r xxyy , 回归直线yabx中公式分别为: 1 2 1 n ii i n i i xxyy b xx ,aybx $ ; 参考数据:308477,909.4868, 4.4998 90e . 第 10 页 / 共 16 页 4、(2020届山东省日照市高三上期末联考) 某公司准备投产一种新产品, 经测算, 已知每年生产 515xx 万件的该种产品所需要的总成本 3 2 23 1630

18、910 x C xxx(万元) ,依据产品尺寸,产品的品质可能出 现优、中、差三种情况,随机抽取了 1000 件产品测量尺寸,尺寸分别在25.26,25.30,25.30,25.34, 25.34,25.38,25.38,25.42,25.42,25.46,25.46,25.50,25.50,25.54(单位:mm)中, 经统计得到的频率分布直方图如图所示. 产品的品质情况和相应的价格m(元/件)与年产量x之间的函数关系如下表所示. 产品品质 立品尺寸的范围 价格m与产量x的函数关系式 优 25.34,25.46 34mx 中 25.26,25.34 3 25 5 mx 差 25.46,25.

19、54 3 20 5 mx 以频率作为概率解决如下问题: (1)求实数a的值; (2)当产量x确定时,设不同品质的产品价格为随机变量,求随机变量的分布列; (3)估计当年产量x为何值时,该公司年利润最大,并求出最大值. 第 11 页 / 共 16 页 5、 (2020 届山东省潍坊市高三上学期统考)班主任为了对本班学生的考试成绩进行分析,决定从本班 24 名 女同 18 名男同学中随机抽取一个容量为 7 的样本进行分析. (1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算出结果) (2)如果随机抽取的 7 名同学的数物理成绩(单位:分)对应如下表: 学生序号i 1

20、 2 3 4 5 6 7 数学成绩 i x 60 65 70 75 85 87 90 物理成绩 i y 70 77 80 85 90 86 93 若规定 85 分以上(包括 85 分)为优秀,从这 7 名同学中抽取 3 名同记 3 名同学中数学和物理成绩均为 优秀的人数为,求的分布列和数学期望; 根据上表数据,求物理成绩y关于数学成绩x的线性回归方程(系数精确到 0.01) ;若班上某位同学的数 学成绩为 96 分,预测该同学的物理成绩为多少分? 附:线性回归方程y bxa , 其中 1 2 1 ()() () n ii i n i i xxyy b xx ,aybx. x y 7 2 1 (

21、) i i xx 7 1 ()() ii i xxyy 76 83 812 526 第 12 页 / 共 16 页 6、 (2020 届山东省滨州市高三上期末)近年,国家逐步推行全新的高考制度.新高考不再分文理科,某省采 用3 3模式,其中语文、数外语三科为必考科目,每门科目满分均为150分.另外考生还要依据想考取的高 校及专业的要求,结合自己的兴趣爱好等因素,在思想政治、历史、地理、物理、化生物6门科目中自选3 门参加考试(6选3) ,每门科目满分均为100分.为了应对新高考,某高中从高一年级1000名学生(其中男 生550人,女生450人)中,采用分层抽样的方法从中抽取n名学生进行调查,其

22、中,女生抽取45人. (1)求n的值; (2)学校计划在高一上学期开设选修中的“物理”和“地理”两个科目,为了了解学生对这两个科目的选课情 况,对抽取到的n名学生进行问卷调查(假定每名学生在“物理”和“地理”这两个科目中必须选择一个科目且 只能选择一个科目) , 下表是根据调查结果得到的一个不完整的22列联表, 请将下面的22列联表补充完 整,并判断是否有99%的把握认为选择科目与性别有关?说明你的理由; 选择“物理” 选择“地理” 总计 男生 10 女生 25 总计 (3)在抽取到的45名女生中,按(2)中的选课情况进行分层抽样,从中抽出9名女生,再从这9名女生 中抽取4人,设这4人中选择“

23、物理”的人数为X,求X的分布列及期望.附: 2 2 () ()()()() n adbc K ab ac cd bd ,na b cd 2 0 P Kk 0.05 0.01 0.005 0.001 0 k 3.841 6.635 7.879 10.828 第 13 页 / 共 16 页 题型二 线性相关与概率的结合 1、 (2020 届山东省潍坊市高三上期末)读书可以使人保持思想活力,让人得到智慧启发,让人滋养浩然正 气书籍是文化的重要载体,读书是承继文化的重要方式某地区为了解学生课余时间的读书情况,随机抽取 了n名学生进行调查, 根据调查得到的学生日均课余读书时间绘制成如图所示的频率分布直方

24、图, 将日均课 余读书时间不低于40分钟的学生称为“读书之星”, 日均课余读书时间低于40分钟的学生称为“非读书之星”: 已知抽取的样本中日均课余读书时间低于10分钟的有10人 (1)求 , n p的值; (2)根据已知条件完成下面的22列联表,并判断是否有95%以上的把握认为“读书之星”与性别有关? 非读书之星 读书之星 总计 第 14 页 / 共 16 页 男 女 10 55 总计 (3)将上述调查所得到的频率视为概率,现从该地区大量学生中,随机抽取3名学生,每次抽取1名,已知每 个人是否被抽到互不影响,记被抽取的“读书之星”人数为随机变量X,求X的分布列和期望E X 附: 2 2 n a

25、dbc K abcdacbd ,其中na b cd . 2 0 P Kk 0.10 0.05 0.025 0.010 0.005 0.001 0 k 2.706 3.841 5.024 6.635 7.879 10.828 2、 (2020 湖北高三期末(理) )某土特产超市为预估 2020 年元旦期间游客购买土特产的情况,对 2019 年元 旦期间的 90 位游客购买情况进行统计,得到如下人数分布表. 购买金额(元) 0,15 15,30 30,45 45,60 60,75 75,90 人数 10 15 20 15 20 10 (1)根据以上数据完成22列联表,并判断是否有95%的把握认为购

26、买金额是否少于 60 元与性别有关. 不少于 60 元 少于 60 元 合计 男 40 女 18 第 15 页 / 共 16 页 合计 (2)为吸引游客,该超市推出一种优惠方案,购买金额不少于 60 元可抽奖 3 次,每次中奖概率为p(每 次抽奖互不影响,且p的值等于人数分布表中购买金额不少于 60 元的频率) ,中奖 1 次减 5 元,中奖 2 次 减 10 元,中奖 3 次减 15 元.若游客甲计划购买 80 元的土特产,请列出实际付款数X(元)的分布列并求 其数学期望. 附:参考公式和数据: 2 2 n adbc K abcdacbd ,na b cd . 附表: 0 k 2.072 2

27、.706 3.841 6.635 7.879 2 0 P Kk 0.150 0.100 0.050 0.010 0.005 3、 (2020 山东省淄博实验中学高三上期末)近年来,国资委.党委高度重视扶贫开发工作,坚决贯彻落实中 央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效,某贫困县为了响 应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积以及相应的管理时间的关系如下表所 示: 土地使用面积x(单位:亩) 1 2 3 4 5 管理时间y(单位:月) 8 10 13 25 24 并调查了某村 300 名村民参与管理的意愿,得到的部分数据如下表所示: 愿意

28、参与管理 不愿意参与管理 男性村民 150 50 第 16 页 / 共 16 页 女性村民 50 (1)求出相关系数r的大小,并判断管理时间y与土地使用面积x是否线性相关? (2)是否有 99.9%的把握认为村民的性别与参与管理的意愿具有相关性? (3)若以该村的村民的性别与参与管理意愿的情况估计贫困县的情况,则从该贫困县中任取 3 人,记取到 不愿意参与管理的男性村民的人数为x,求x的分布列及数学期望 参考公式: 1 1 22 1 11 ()() , ()() n i i nn i ii xxyy r xxyy 2 2 () , ()()()() n adbc k ab cd ac bd 其中na b cd 临界值表: 2 0 ()P Kk 0.100 0.050 0.025 0.010 0.001 0 k 2.706 3.841 5.024 6.635 10.828 参考数据:63525.2

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 高中 > 高中数学 > 数学高考 > 一轮复习