1、章末检测(一)(时间:120分钟满分:160分)一、填空题(本大题共14小题,每小题5分,共70分)1下列有关线性回归的说法:当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;在平面直角坐标系中用描点的方法得到具有相关关系的两个变量的一组数据的图形叫做散点图;线性回归直线得到具有代表意义的线性回归方程;任何一组观测值都能得到具有代表意义的线性回归方程其中错误的是_(填序号)2已知x与y的一组数据,x135y246则有以下结论:x与y正相关;x与y负相关;其回归方程为yx1;其相关系数r1.其中正确的是_(填序号)3为了判断高三年级学生是否喜欢踢足球与性别的关系,对
2、某班50名学生进行了问卷调查,得到下表:喜欢踢足球不喜欢踢足球合计男生19625女生91625合计282250根据表中的数据及统计量2的公式,算得28.12.临界值表:P(2x0)0.0100.0050.001x06.6357.87910.828根据临界值表,你认为喜欢踢足球与性别有关的把握有_4下表是x与y之间的一组数据,则y关于x的线性回归直线必过点_.x0123y13575.对有关数据的分析可知,每一立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压度y(单位:kg/cm2)之间具有线性相关关系,其线性回归方程为0.30x9.99.根据建设项目的需要,28天后混凝土的抗压度不得
3、低于89.7 kg/cm2,每立方米混凝土的水泥用量最少应为_kg.(精确度0.1 kg)6有5组(x,y)的统计数据:(1,2),(2,4),(4,5),(3,10),(10,12),要使剩下的数据具有较强的相关关系,应去掉的一组数据是_7某班主任对全班50名学生进行了作业量多少的调查,数据如下表,则喜不喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为_认为作业多认为作业不多合计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523合计2624508.某车间加工零件的数量x与加工时间y的统计数据如下表:零件数x(个)102030加工时间y(分钟)213039现已求得上表数据的回归方程x中的值为
4、0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为_分钟9某调查者从调查中获知某公司近年来科研费用支出x(万元)与公司所获得利润y(万元)的统计资料如下表:序号科研费用支出xi利润yixiyix1531155252114044012134301201645341702553257596220404总计301801 000200则利润y对科研费用支出x的线性回归方程为_.10下表是某厂14月份用水量(单位:百吨)的一组数据,月份x1234用水量y4.5432.5由某散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程0.7x,则该厂6月份的用水量约为_百吨11下
5、列关于回归分析与独立性检验的说法正确的是_(填序号)回归分析和独立性检验没有什么区别;回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;独立性检验可以100%确定两个变量之间是否具有某种关系12某单位为了了解用电量y(度)与气温x()之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程为x,其中2.现预测当气温为4 时,用电量的度数约为_.气温x()1813101用电量y(度)2434386413.某部门通过随机调查89名工作人员的休闲方式是
6、读书还是健身,得到的数据如下表:读书健身总计女243155男82634总计325789在犯错误的概率不超过_的前提下认为性别与休闲方式有关系14已知样本容量为11,计算得i510,i214,回归方程为0.3x,则_,_.(精确到0.01)二、解答题(本大题共6小题,共90分)15(14分)暑期社会实践中,小闲所在的小组调查了某地家庭人口数x与每天对生活必需品的消费y的情况,得到的数据如下表:x/人24568y/元2030505070(1)利用相关系数r判断y与x是否线性相关;(2)根据上表提供的数据,求出y关于x的线性回归方程16(14分)某校高一年级理科有8个班,在一次数学考试中成绩情况分析
7、如下:班级12345678大于145分人数66735337不大于145分人数3939384240424238附:xiyi171,x204.(1)求145分以上成绩y对班级序号x的线性回归方程;(精确到0.000 1)(2)能否在犯错误的概率不超过0.01的前提下认为7班与8班的成绩是否优秀(大于145分)与班级有关系17(14分)为了调查某大学学生在某天上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查,得到了如下的统计结果:表1:男生上网时间与频数分布表上网时间(分)30,40)40,50)50,60)60,70)70,80人数525302515表2:女生上网时间与频数分布表
8、上网时间(分)30,40)40,50)50,60)60,70)70,80人数1020402010(1)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数;(2)完成下面的22列联表,并回答能否有90%的把握认为“大学生上网时间与性别有关”.上网时间少于60分钟上网时间不少于60分钟总计男生女生总计附:2.P(2x0)0.500.400.250.150.10x00.4550.7081.3232.0722.706P(2x0)0.050.0250.0100.0050.001x03.8415.0246.6357.87910.82818(16分)有甲、乙两个班级进行数学考试,按照大于或等于
9、85分为优秀,85分以下为非优秀统计成绩后,得到如下的22列联表已知从全部210人中随机抽取1人为优秀的概率为.优秀非优秀总计甲班20乙班60总计210请完成上面的22列联表,若按99%的可靠性要求,则能否认为“成绩与班级有关”?19(16分)某校团对“学生性别与是否喜欢韩剧有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的,若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?20(16分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日
10、的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:日期12月1日12月2日12月3日12月4日12月5日温差x()101113128发芽数y(颗)2325302616该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程x;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是
11、否可靠?答案精析1解析任何一组观测值并不都能得到具有代表意义的线性回归方程2解析从数据看,随着x的增加,y增加,所以x与y正相关,对,错399.5%4(1.5,4)解析1.5,4,样本点的中心为(1.5,4),而回归直线必过样本点的中心,故必过(1.5,4)5265.7解析由0.30x9.9989.7,得x265.7.6.(3,10)解析画散点图,从散点图观察(3,10)为一个特殊点,所以去掉(3,10)这组数据797.5%解析假设H0:喜欢玩电脑游戏与认为作业量的多少没有关系,根据列联表中的数据,可以求得25.059,对照临界值表,当假设成立时,25.024的概率约为0.025,所以我们有9
12、7.5%的把握认为喜欢玩电脑游戏与认为作业量的多少有关8102解析由已知可得20,30,又0.9,300.92012.回归方程为0.9x12.当x100时,0.910012102.9.2x20解析设线性回归方程为x.由表中数据,得2,302520,线性回归方程为2x20.101.05解析2.5,3.5,0.7,3.50.72.55.25.当x6时,0.765.251.05.11解析由回归分析、独立性检验的意义知,回归分析与独立性检验都是研究两个变量之间的相关性,但方法与手段有所不同,研究角度不同,由其意义知,正确1268解析由题意可知,(1813101)10,(24343864)40,2.又回
13、归直线2x过点(10,40),故60.所以当x4时,2(4)6068.130.10解析由列联表中的数据,得23.6892.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系1446.365.55解析由题意得i46.36,i,因为0.3,所以0.3,可得5.55.15解(1)由表中数据,利用科学计算器计算,得5,44,r0.975.rr0.050.878,y与x之间具有线性相关关系(2)根据以上数据,可得8.5,448.551.5,所求的线性回归方程为1.58.5x. 16解(1)4.5,5,xiyi171,x204,0.214 3,b5(0.214 3)4.55.964
14、 4,所以线性回归方程为0.214 3x5.964 4.(2)21.8,因为1.86.635,所以在犯错误的概率不超过0.01的前提下不能认为7班与8班的成绩是否优秀(大于145分)与班级有关系17解(1)设上网时间不少于60分钟的女生人数为x,依题意有,解得x225,所以估计上网时间不少于60分钟的女生有225人(2)填22列联表如下:上网时间少于60分钟上网时间不少于60分钟总计男生6040100女生7030100总计13070200由表中数据可得到22.2010.828,所以若按照99%的可靠性要求,则能够判断成绩与班级有关19解设男生人数为x,依题意可得列联表如下:喜欢韩剧不喜欢韩剧总
15、计 男生x女生总计x若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则23.841,由2x3.841,解得x10.24.又,为整数,若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人20解(1)设事件A表示“选取的2组数据恰好是不相邻2天的数据”,则表示“选取的数据恰好是相邻2天的数据”基本事件总数为10,事件包含的基本事件数为4.P(),P(A)1P().(2)12,27,iyi977,434,2.5, 272.5123,2.5x3.(3)由(2)知,当x10时,22,误差不超过2颗;当x8时,17,误差不超过2颗故所求得的线性回归方程是可靠的