2020版高考数学大一轮复习 第十章 算法、统计与统计案例 10.4 变量的相关性、统计案例

上传人:hua****011 文档编号:121535 上传时间:2020-02-20 格式:DOCX 页数:31 大小:601.13KB
下载 相关 举报
2020版高考数学大一轮复习 第十章 算法、统计与统计案例 10.4 变量的相关性、统计案例_第1页
第1页 / 共31页
2020版高考数学大一轮复习 第十章 算法、统计与统计案例 10.4 变量的相关性、统计案例_第2页
第2页 / 共31页
2020版高考数学大一轮复习 第十章 算法、统计与统计案例 10.4 变量的相关性、统计案例_第3页
第3页 / 共31页
2020版高考数学大一轮复习 第十章 算法、统计与统计案例 10.4 变量的相关性、统计案例_第4页
第4页 / 共31页
2020版高考数学大一轮复习 第十章 算法、统计与统计案例 10.4 变量的相关性、统计案例_第5页
第5页 / 共31页
点击查看更多>>
资源描述

1、10.4变量的相关性、统计案例最新考纲考情考向分析1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解独立性检验的基本思想、方法及其初步应用.4.了解回归分析的基本思想、方法及简单应用.回归分析,独立性检验是全国卷高考重点考查的内容,必考一个解答题,选择、填空题中也会出现.主要考查回归方程,相关系数,利用回归方程进行预测,独立性检验的应用等.1.变量间的相关关系2.散点图以一个变量的取值为横坐标,另一个变量的相应取值为纵坐标,在直角坐标系中描点,这样的图形叫做散点图.3.回归直线方程与回归分析

2、(1)直线方程 abx,叫做Y对x的回归直线方程,b叫做回归系数.要确定回归直线方程,只要确定a与回归系数b.(2)用最小二乘法求回归直线方程中的a,b有下列公式 , ,其中的 , 表示是由观察值按最小二乘法求得的a,b的估计值.(3)相关性检验计算相关系数r,r具有以下性质:|r|1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱;|r|r0.05,表明有95%的把握认为x与Y之间具有线性相关关系,回归直线方程有意义;否则寻找回归直线方程毫无意义.4.独立性检验(1)22列联表:B合计An11n12n1n21n22n2合计n1n2n其中n1n11n12,n2n21n2

3、2,n1n11n21,n2n12n22,nn11n12n21n22.(2)2统计量:2.(3)两个临界值:3.841与6.635当23.841时,有95%的把握说事件A与B有关;当26.635时,有99%的把握说事件A与B有关;当23.841时,认为事件A与B是无关的.概念方法微思考1.变量的相关关系与变量的函数关系有什么区别?提示相同点:两者均是指两个变量的关系.不同点:函数关系是一种确定的关系,相关关系是一种非确定的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.如何判断两个变量间的线性相关关系?提示散点图中点的分布从整体上看大致在一条直线附近,或者通过计算

4、相关系数作出判断.3.独立性检验的基本步骤是什么?提示列出22列联表,计算2值,根据临界值表得出结论.4.回归直线方程是否都有实际意义?根据回归直线方程进行预报是否一定准确?提示(1)不一定都有实际意义.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.(2)根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.题组一思考辨析1.判断下列结论是否正确(请在括号中打“”或“”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.()(2)“名师出高徒”可以解释为教师的教学水平与学生的水

5、平成正相关关系.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()(4)某同学研究卖出的热饮杯数y与气温x()之间的关系,得回归直线方程2.352x147.767,则气温为2时,一定可卖出143杯热饮.()(5)事件X,Y关系越密切,则由观测数据计算得到的2的值越大()题组二教材改编2.为调查中学生近视情况,测得某校男生150名中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力()A.回归分析 B.期望与方差C.独立性检验 D.概率答案C解析“近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.3.下面是22

6、列联表:y1y2合计x1a2173x2222547合计b46120则表中a,b的值分别为()A.94,72 B.52,50C.52,74 D.74,52答案C解析a2173,a52.又a22b,b74.4.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程0.67x54.9.零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为_.答案68解析由30,得0.673054.975.设表中的“模糊数字”为a,则62a758189755,a68.题组三易错自纠

7、5.某医疗机构通过抽样调查(样本容量n1 000),利用22列联表和2统计量研究患肺病是否与吸烟有关.计算得24.453,经查阅临界值表知P(23.841)0.05,现给出四个结论,其中正确的是()A.在100个吸烟的人中约有95个人患肺病B.若某人吸烟,那么他有95%的可能性患肺病C.有95%的把握认为“患肺病与吸烟有关”D.只有5%的把握认为“患肺病与吸烟有关”答案C解析由已知数据可得,有10.0595%的把握认为“患肺病与吸烟有关”.6.在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系)学生的编号i12345数学成绩x8075706560物理成绩y

8、7066686462现已知其回归直线方程为0.36x,则根据此线性回归方程估计数学得90分的同学的物理成绩为_.(四舍五入到整数)答案73解析70,66,所以660.3670,40.8,即回归直线方程为0.36x40.8.当x90时,0.369040.873.273.题型一相关关系的判断例1 (1)观察下列各图形,其中两个变量x,y具有相关关系的图是()A. B. C. D.答案C解析由散点图知中的点都分布在一条直线附近.中的点都分布在一条曲线附近,所以中的两个变量具有相关关系.(2)(2018沈阳质检)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)的柱形图.以下结论不正

9、确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案D解析从2006年,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确;2007年二氧化硫排放量较2006年降低了很多,B选项正确;虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,C选项正确;自2006年以来我国二氧化硫年排放量与年份负相关,D选项错误,故选D.思维升华 判定两个变量正,负相关性的方

10、法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:当r0时,正相关;当r0时,正相关;当 0时,负相关跟踪训练1在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为()A.1 B.0C. D.1答案A解析完全的线性关系,且为负相关,故其相关系数为1,故选A.题型二回归分析命题点1线性回归分析例2 下图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1

11、7分别对应年份20112017.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量.附注:参考数据:i9.32,iyi40.17,0.55,2.646.参考公式:相关系数r,回归方程t中斜率和截距的最小二乘估计公式分别为:, .解(1)由折线图中数据和附注中参考数据得4,(ti)228, 0.55.(ti)(yi)iyii40.1749.322.89,所以r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.(2)

12、由1.331及(1)得0.10,1.3310.1040.93.所以y关于t的回归方程为0.930.10t.将2019年对应的t9代入回归方程得0.930.1091.83.所以预测2019年我国生活垃圾无害化处理量约为1.83亿吨.命题点2非线性回归例3 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.(xi)2(wi)2(xi)(yi)(wi)(yi)46.65636.8289.81.61 469108.8表中w

13、i,i.(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线 u的斜率和截距的最小二乘估计分别为, .解(1)由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w,先建立y关于w的线性回

14、归方程,由于 68, 563686.8100.6,所以y关于w的回归直线方程为 100.668w,因此y关于x的回归方程为 100.668.(3)由(2)知,当x49时,年销售量y的预报值 100.668576.6,年利润z的预报值 576.60.24966.32.根据(2)的结果知,年利润z的预报值 0.2(100.668)xx13.620.12.所以当6.8,即x46.24时, 取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.思维升华 回归分析问题的类型及解题方法(1)求回归方程根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关.利用公式,求出回归系数.待定系数

15、法:利用回归直线过样本点的中心求系数.(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数.(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.跟踪训练2 (2018全国)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型: 30.413.5t;根据2010年至2016年的数据(时间变量t的

16、值依次为1,2,7)建立模型: 9917.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预报值;(2)你认为用哪个模型得到的预报值更可靠?并说明理由.解(1)利用模型,可得该地区2018年的环境基础设施投资额的预报值为 30.413.519226.1(亿元).利用模型,可得该地区2018年的环境基础设施投资额的预报值为 9917.59256.5(亿元).(2)利用模型得到的预报值更可靠.理由如下:()从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基

17、础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型 9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预报值更可靠.()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预报值226.1亿元的增幅明显偏低,而利用模型得到的预报值的增幅比较合理,说明利用模型得到的预报值更可靠.题型三独立性检验例4 (2017全国)海水养殖场进行某水产品

18、的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50 kg箱产量50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.附:P(K2k0)0.0500.010k03.8416.6352.解(1)旧养殖法的箱产量低于50 kg的频率为(0.0120.0140.0240.0340.040)50.62.因此,事件A的概率估计值为0.62.(

19、2)根据箱产量的频率分布直方图得列联表如下:箱产量6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.思维升华 (1)比较几个分类变量有关联的可能性大小的方法通过计算2的大小判断:2越大,两变量有关联的可能性越大通过计算|n11n22n12n21|的大小判断:|n11n22n12n21|越大,两变量有关

20、联的可能性越大(2)独立性检验的一般步骤根据样本数据制成22列联表根据公式2计算2.比较2与临界值的大小关系,作统计推断跟踪训练3 微信是现代生活进行信息交流的重要工具,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中75%是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中有是青年人.(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出22列联表:青年人中年人合计经常使用微信不经常使

21、用微信合计(2)根据22列表中的数据利用独立性检验的方法判断是否有99.9%的把握认为“经常使用微信与年龄有关”?附:2.P(2k0)0.0100.001k06.63510.828解(1)由已知可得,该公司员工中使用微信的有20090%180(人).经常使用微信的有18060120(人),其中青年人有12080(人),使用微信的人中青年人有18075%135(人),故22列联表如下:青年人中年人合计经常使用微信8040120不经常使用微信55560合计13545180(2)将列联表中数据代入公式可得,213.333,由于13.33310.828,所以有99.9%的把握认为“经常使用微信与年龄有

22、关”.回归直线方程及其应用数据分析是指针对研究对象获得相关数据,运用统计方法对数据中的有用信息进行分析和推断,形成知识的过程.主要包括:收集数据、整理数据、提取信息、构建模型对信息进行分析、推断、获得结论.例 某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20062008201020122014需求量/万吨236246257276286(1)利用所给数据求年需求量与年份之间的回归直线方程x;(2)利用(1)中所求出的回归直线方程预测该地2019年的粮食需求量.解(1)由所给数据看出,年需求量与年份之间近似直线上升,下面来求线性回归方程,先将数据处理如下表.年份201042024需求2

23、57211101929对处理的数据,容易算得0,3.2,6.5, 3.2.由上述计算结果,知所求回归直线方程为2576.5(x2010)3.2,即6.5(x2010)260.2.(2)利用所求得的回归直线方程,可预测2019年的粮食需求量大约为6.5(20192010)260.26.59260.2318.7(万吨).素养提升例题中利用所给数据求回归方程的过程体现的就是数据分析素养.1.根据如下样本数据:x345678y4.02.50.50.50.40.1得到的回归直线方程为 x,则()A.0, 0 B.0, 0C.0 D.0, 0答案B解析根据给出的数据可发现:整体上y与x呈现负相关,所以 0

24、,故选B.2.下表提供了某工厂节能降耗技术改造后,一种产品的产量x(单位:吨)与相应的生产能耗y(单位:吨)的几组对应数据:x/吨3456y/吨2.5t44.5根据上表提供的数据,求得y关于x的回归直线方程为0.7x0.35,那么表格中t的值为()A.3 B.3.15 C.3.25 D.3.5答案A解析4.5,回归直线方程过样本点的中心(,),所以0.74.50.35,解得t3.3.下表是我国某城市在2017年1月份至10月份期间各月最低温度与最高温度(单位:)的数据一览表.月份12345678910最高温度/59911172427303121最低温度/1231271719232510已知该城

25、市的各月最低温与最高温具有相关关系,根据该一览表,则下列结论错误的是()A.最低温度与最高温度为正相关B.每月最高温度与最低温度的平均值在前8个月逐月增加C.月温差(最高温度减最低温度)的最大值出现在1月D.1月至4月的月温差(最高温度减最低温度)相对于7月至10月,波动性更大答案B解析将最高温度、最低温度、温差列表如下:月份12345678910最高温度/59911172427303121最低温度/1231271719232510温差度/171281310787611由表格可知,最低温度大致随最高温度的升高而升高,A正确;每月最高温度与最低温度的平均值在前8个月不是逐月增加,B错误;月温差的

26、最大值出现在1月,C正确;1月至4月的月温差相对于7月至10月,波动性更大,D正确.4.对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i1,2,8),其回归直线方程是x,且x1x2x3x82(y1y2y3y8)6,则实数的值是()A. B. C. D.答案B解析依题意可知样本点的中心为,则 ,解得 .5.(2018大连调研)某商场为了了解毛衣的月销售量y(单位:件)与月平均气温x(单位:)之间的关系,随机统计了某4个月的销售量与当月平均气温,其数据如下表:月平均气温x/171382月销售量y/件24334055由表中数据算出回归直线方程x中的2,气象部门预测下个月的平均气温为6

27、,据此估计该商场下个月毛衣销售量为()A.46 件 B.40 件C.38 件 D.58 件答案A解析由题中数据,得10,38,回归直线 x 过点(,),且 2,所以 58,则回归直线方程为 2x58,所以当x6时, 46,故选A.6(2018江西南城一中、高安中学等九校联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线一线合计愿生452065不愿生132235合计5842100由2,得29.616.参照下表,P(2k0)0.0500.010k03.8416.635正确的结论是()A有95%以

28、上的把握认为“生育意愿与城市级别有关”B有95%以上的把握认为“生育意愿与城市级别无关”C有99%以上的把握认为“生育意愿与城市级别有关”D有99%以上的把握认为“生育意愿与城市级别无关”答案C解析29.6166.635,有99%以上的把握认为“生育意愿与城市级别有关”,故选C.7.某市居民20102014年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:年份20102011201220132014收入x11.512.11313.315支出y6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与年平均支出有_相关关系.(填“正”

29、或“负”)答案13正解析中位数是13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正相关关系.8.某公司为确定明年投入某产品的广告支出,对近5年的年广告支出m与年销售额t(单位:百万元)进行了初步统计,得到下列表格中的数据:年广告支出m24568年销售额t3040p5070经测算,年广告支出m与年销售额t满足回归直线方程6.5m17.5,则p_.答案60解析由于回归直线过样本点的中心,5,代入6.5m17.5,解得p60.9.以下四个命题,其中正确的序号是_.从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样

30、是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近于1;在回归直线方程0.2x12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位;对分类变量X与Y的统计量2来说,2越小,“X与Y有关系”的把握程度越大答案解析是系统抽样;对于,统计量2越小,说明两个相关变量有关系的把握程度越小.10为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示22列联表:理科文科合计男131023女72027合计203050已知P(23.841)0.05,P(25.024)0.025.根据表中数据,得到24.844,则有_的把握认为选修文科与性别有关答案95%解析由题

31、意,24.844,因为5.0244.8443.841,所以有95%的把握认为选修文科与性别有关11.某地区2009年至2015年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2009201020112012201320142015年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的回归直线方程;(2)利用(1)中的回归直线方程,分析2009年至2015年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2019年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:,.解(1)由所给数据计算得(1234567)4,(2

32、.93.33.64.44.85.25.9)4.3,(ti)2941014928,(ti)(yi)(3)(1.4)(2)(1)(1)(0.7)00.110.520.931.614,0.5,4.30.542.3,所求回归直线方程为0.5t2.3.(2)由(1)知, 0.50,故2009年至2015年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2019年的年份代号t11代入(1)中的回归直线方程,得 0.5112.37.8,故预测该地区2019年农村居民家庭人均纯收入为7.8千元.12.某省会城市地铁将于2019年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查

33、,随机抽查了50人,他们的收入与态度如下:月收入(单位:百元)15,25)25,35)35,45)45,55)55,65)65,75赞成定价者人数123534认为价格偏高者人数4812521(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差异是多少(结果保留2位小数);(2)由以上统计数据填下面22列联表,分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.月收入不低于55百元的人数月收入低于55百元的人数合计认为价格偏高者赞成定价者合计附:2.P(2k0)0.050.01k03.8416.635解(1)

34、“赞成定价者”的月平均收入为x150.56.“认为价格偏高者”的月平均收入为x238.75,“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x1x250.5638.7511.81(百元).(2)根据条件可得22列联表如下:月收入不低于55百元的人数月收入低于55百元的人数合计认为价格偏高者32932赞成定价者71118合计10405026.2726.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、

35、女的比例,再把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样方法更好.14.如图是某企业2010年至2016年的污水净化量(单位:吨)的折线图.注:年份代码17分别对应年份20102016.(1)由折线图看出,可用线性回归模型拟合y和t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程,预测2019年该企业的污水净化量.参考数据:54, (ti)(yi)21,3.74, (yii)2.参考公式:相关系数r,回归直线方程t, .解(1)由折线图中的数据得,4, (ti)228, (yi)218,所以r0.94.因为y与t的相关系数近似为0.94,说明y与t的线性相关程度相当大

36、,所以可以用线性回归模型拟合y与t的关系.(2)因为54,所以 54451,所以y关于t的回归直线方程为t t51.将2019年对应的t10代入得 105158.5,所以预测2019年该企业污水净化量约为58.5吨.15.在一组样本数据(x1,y1),(x2,y2),(x6,y6)的散点图中,若所有样本点(xi,yi)(i1,2,6)都在曲线ybx2附近波动.经计算xi12,yi14,x23,则实数b的值为_.答案解析令tx2,则曲线的回归方程变为线性的回归方程,即ybt,此时,代入ybt,得b,解得b.16.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.若有95%的把握认为是否喜欢韩剧和性别有关,求男生至少有_人.P(2k0)0.0500.0100.001k03.8416.63510.828答案18解析设男生人数为x,由题意可得列联表如下:喜欢韩剧不喜欢韩剧合计男生x女生合计若有95%的把握认为是否喜欢韩剧和性别有关,则23.841,即23.841,解得212.697.因为各部分人数均为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人.

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 高中 > 高中数学 > 数学高考 > 一轮复习