1、 1 第第 1 1 讲讲 随机抽样随机抽样 1对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽 样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( ) Ap1p2p3 Bp2p3p1 Cp1p3p2 Dp1p2p3 解析:选 D.由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1p2p3. 2某中学初中部共有 110 名教师,高中部共有 150 名教师,其性别比例如图所示,则该校 女教师的人数为( ) A93 B123 C137 D167 解析:选 C.初中部的女教师人数为 11070%77,高中部的女教师人数为 150(16
2、0%) 60,该校女教师的人数为 7760137,故选 C. 3现用系统抽样方法从已编号(160)的 60 枚新型导弹中,随机抽取 6 枚进行试验,则所 选取的 6 枚导弹的编号可能是( ) A5,10,15,20,25,30 B2,4,8,16,32,48 C5,15,25,35,45,55 D1,12,34,47,51,60 解析:选 C.从 60 枚新型导弹中随机抽取 6 枚,采用系统抽样间隔应为60 6 10,只有 C 选项 中导弹的编号间隔为 10. 4某班有 34 位同学,座位号记为 01,02,34,用下面的随机数表选取 5 组数作为参 加青年志愿者活动的五位同学的座号 选取方法
3、是从随机数表第一行的第 6 列数字开始, 由 左到右依次选取两个数字,则选出来的第 4 个志愿者的座号是( ) 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 A23 B09 C02 D16 2 解析:选 D.从随机数表第一行的第 6 列数字 3 开始,由左到右依次选取两个数字,不超过 34 的依次为 21,32,09,16,17,故第 4 个志愿者的座号为 16. 5某工厂的一、二、三车间在 2017 年 1
4、1 月份共生产了 3 600 双皮靴,在出厂前检查这批 产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为 a、b、c,且a、b、c成等差数列,则二车间生产的产品数为( ) A800 B1 000 C1 200 D1 500 解析:选 C.因为a、b、c成等差数列,所以 2bac,所以从二车间抽取的产品数占抽取 产品总数的1 3,根据分层抽样的性质可知,二车间生产的产品数占产品总数的 1 3,所以二车间 生产的产品数为 3 6001 31 200.故选 C. 6(2019贵阳市检测)某高校有教授 120 人,副教授 100 人,讲师 80 人,助教 60 人,现
5、用分层抽样的方法从以上所有老师中抽取一个容量为n的样本 已知从讲师中抽取的人数为 16,那么n_ 解析:依题意得, 80 1201008060 16 n ,由此解得n72. 答案:72 7为了解 1 200 名学生对学校某项教改实验的意见,打算从中抽取一个容量为 30 的样本, 考虑采取系统抽样,则分段的间隔k为_ 解析:在系统抽样中,确定分段间隔k,对编号进行分段,kN n(N 为总体的容量,n为样本 的容量),所以kN n 1 200 30 40. 答案:40 8一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量 如下表(单位:辆): 轿车A 轿车B 轿车C 舒
6、适型 100 150 z 标准型 300 450 600 按类型用分层抽样的方法在这个月生产的轿车中抽取 50 辆,其中有A类轿车 10 辆,则z 的值为_ 解析:设该厂这个月共生产轿车n辆, 由题意得50 n 10 100300,所以 n2 000, 则z2 000100300150450600400. 3 答案:400 9某初级中学共有学生 2 000 名,各年级男、女生人数如下表: 初一年级 初二年级 初三年级 女生 373 x y 男生 377 370 z 已知在全校学生中随机抽取 1 名,抽到初二年级女生的概率是 0.19. (1)求x的值; (2)现用分层抽样的方法在全校抽取 48
7、 名学生,问应在初三年级抽取多少名? 解:(1)因为 x 2 0000.19,所以 x380. (2)初三年级人数为yz2 000(373377380370)500,现用分层抽样的方法在全 校抽取 48 名学生,应在初三年级抽取的人数为 48 2 00050012(名) 10某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结 果(人数分布)如下表: 学历 35 岁以下 3550 岁 50 岁以上 本科 80 30 20 研究生 x 20 y (1)用分层抽样的方法在 3550 岁年龄段的专业技术人员中抽取一个容量为 5 的样本, 将该 样本看成一个总体,从中任取 2
8、 人,求至少有 1 人学历为研究生的概率; (2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人, 其中 35 岁以下 48 人, 50 岁以上10 人, 再从这N个人中随机抽取 1人, 此人的年龄为 50岁以上的概率为 5 39, 求x,y的值 解:(1)用分层抽样的方法在 3550 岁年龄段的专业技术人员中抽取一个容量为 5 的样本, 设抽取学历为本科的人数为m,所以30 50 m 5,解得 m3. 抽取的样本中有研究生 2 人,本科生 3 人,分别记作S1,S2;B1,B2,B3. 从中任取 2 人的所有等可能基本事件共有 10 个:(S1,B1),(S1,B2),(S1
9、,B3),(S2,B1), (S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3) 其中至少有 1 人的学历为研究生的基本事件有 7 个:(S1,B1), (S1,B2),(S1,B3),(S2,B1), (S2,B2),(S2,B3),(S1,S2) 所以从中任取 2 人,至少有 1 人学历为研究生的概率为 7 10. 4 (2)由题意,得10 N 5 39,解得 N78. 所以 3550 岁中被抽取的人数为 78481020, 所以 48 80 x 20 50 10 20y, 解得x40,y5. 即x,y的值分别为 40,5. 1某学校有体育特长生
10、25 人,美术特长生 35 人,音乐特长生 40 人用分层抽样的方法从 中抽取 40 人,则抽取的体育特长生、美术特长生、音乐特长生的人数分别为( ) A8,14,18 B9,13,18 C10,14,16 D9,14,17 解析:选 C.因为 253540100, 用分层抽样的方法从中抽取 40 人, 所以每个个体被抽到的概率是P 40 100 2 50.4, 所以体育特长生 25 人应抽 250.410(人), 美术特长生 35 人应抽 350.414(人), 音乐特长生 40 人应抽 400.416(人) 2(2019广东肇庆模拟)一个总体中有 100 个个体,随机编号为 0,1,2,9
11、9.依编号 顺序平均分成 10 个小组,组号依次为 1,2,10.现抽取一个容量为 10 的样本,规定如 果在第 1 组中随机抽取的号码为m,那么在第k组中抽取的号码的个位数字与mk的个位 数字相同若m6,则在第 7 组中抽取的号码是( ) A63 B64 C65 D66 解析:选 A.由题设知,若m6,则在第 7 组中抽取的号码个位数字与 13 的个位数字相同, 而第 7 组中数字编号依次为 60,61,62,63,69,故在第 7 组中抽取的号码是 63.故选 A. 3北京某校三个年级共有 18 个班,学校为了了解同学们的心理状况,将每个班编号,依次 为 1 到 18,现用系统抽样方法,抽
12、取 6 个班进行调查若抽到的编号之和为 57,则抽到的 最小编号为_ 解析:系统抽样的间隔为18 6 3. 设抽到最小编号为x, 则x(3x)(6x)(9x)(12x)(15x)57.解得x2. 5 答案:2 4某高中在校学生有 2 000 人为了响应“阳光体育运动”的号召,学校开展了跑步和登 山比赛活动每人都参与而且只参与其中一项比赛,各年级参与比赛的人数情况如下表: 高一年级 高二年级 高三年级 跑步 a b c 登山 x y z 其中abc235,全校参与登山的人数占总人数的2 5.为了了解学生对本次活动的满 意程度,从中抽取一个 200 人的样本进行调查,则从高二年级参与跑步的学生中应
13、抽取 _人 解析:根据题意可知样本中参与跑步的人数为 2003 5120,所以从高二年级参与跑步的学 生中应抽取的人数为 120 3 23536. 答案:36 5为了解某市市民晚饭后 1 小时内的生活方式,调查小组设计了“阅读”“锻炼”“看电 视”和“其他”四个选项, 用随机抽样的方法调查了该市部分市民, 并根据调查结果绘制成 统计图如图所示 根据统计图所提供的信息,解答下列问题: (1)本次共调查了_名市民; (2)补全条形统计图; (3)该市共有 480 万市民,估计该市市民晚饭后 1 小时内“锻炼”的人数 解:(1)本次共调查的市民人数为 80040%2 000.故填 2 000. (2
14、)晚饭后选择“其他”的人数为 2 00028%560,晚饭后选择“锻炼”的人数为 2 000 800240560400. 将条形统计图补充完整,如图所示 6 (3)晚饭后选择“锻炼”的人数所占的比例为:4002 00020%,该市市民晚饭后 1 小时内 锻炼的人数为:48020%96(万) 6据报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改” 引起广泛关注 为了解某地区学生和包括老师、 家长在内的社会人士对高考英语改革的看法, 某媒体在该地区选择了 3 600 人进行调查,就“是否取消英语听力”问题进行了问卷调查统 计,结果如下表: 态度 调查人群 应该取消 应该保留
15、 无所谓 在校学生 2 100 人 120 人 y人 社会人士 600 人 x人 z人 已知在全体样本中随机抽取 1 人,抽到持“应该保留”态度的人的概率为 0.05. (1)现用分层抽样的方法在所有参与调查的人中抽取 360 人进行问卷访谈,问应在持“无所 谓”态度的人中抽取多少人? (2)在持“应该保留”态度的人中,用分层抽样的方法抽取 6 人,再平均分成两组进行深入 交流求第一组中在校学生人数的分布列和数学期望 解:(1)因为抽到持“应该保留”态度的人的概率为 0.05, 所以120 x 3 600 0.05,解得x60. 所以持“无所谓”态度的人数共有 3 6002 100120600
16、60720, 所以应在持“无所谓”态度的人中抽取 720 360 3 60072 人 (2)由(1)知持“应该保留”态度的一共有 180 人, 所以在所抽取的 6 人中,在校学生为120 18064 人,社会人士为 60 18062 人,于是第一组 在校学生人数1,2,3, P(1)C 1 4C 2 2 C 3 6 1 5,P(2) C 2 4C 1 2 C 3 6 3 5,P(3) C 3 4C 0 2 C 3 6 1 5, 的分布列为 1 2 3 P 1 5 3 5 1 5 所以E()11 52 3 53 1 52. 7 第第 2 2 讲讲 用样本估计总体用样本估计总体 1把样本容量为 2
17、0 的数据分组,分组区间与频数如下:10,20),2;20,30),3;30, 40), 4; 40, 50), 5; 50, 60), 4; 60, 70, 2, 则在区间10, 50)上的数据的频率是( ) A0.05 B0.25 C0.5 D0.7 解析:选 D.由题知,在区间10,50)上的数据的频数是 234514,故其频率为14 20 0.7. 2(2019广西三市第一次联考)在如图所示一组数据的茎叶图中,有一个数字被污染后模 糊不清,但曾计算得该组数据的极差与中位数之和为 61,则被污染的数字为( ) A1 B2 C3 D4 解析: 选B.由题图可知该组数据的极差为482028,
18、 则该组数据的中位数为612833, 易得被污染的数字为 2. 3(2019岳阳模拟)某商场在国庆黄金周的促销活动中,对 10 月 2 日 9 时到 14 时的销售 额进行统计,其频率分布直方图如图所示,已知 9 时至 10 时的销售额为 2.5 万元,则 11 时到 12 时的销售额为( ) A6 万元 B8 万元 C10 万元 D12 万元 解析:选 C.设 11 时到 12 时的销售额为x万元,依题意有2.5 x 0.10 0.40,解得 x10. 4(2018高考全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实 现翻番 为更好地了解该地区农村的经济收入变化情况, 统计了
19、该地区新农村建设前后农村 的经济收入构成比例,得到如下饼图: 8 则下面结论中不正确的是( ) A新农村建设后,种植收入减少 B新农村建设后,其他收入增加了一倍以上 C新农村建设后,养殖收入增加了一倍 D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 解析:选 A.法一:设建设前经济收入为a,则建设后经济收入为 2a,则由饼图可得建设前 种植收入为 0.6a,其他收入为 0.04a,养殖收入为 0.3a.建设后种植收入为 0.74a,其他收 入为 0.1a,养殖收入为 0.6a,养殖收入与第三产业收入的总和为 1.16a,所以新农村建设 后,种植收入减少是错误的故选 A. 法二
20、:因为 0.60.372,所以新农村建设后,种植收入增加,而不是减少,所以 A 是错误 的故选 A. 5某人 5 次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平 均数为 10,方差为 2,则|xy|的值为( ) A1 B2 C3 D4 解析: 选 D.由题意这组数据的平均数为 10, 方差为 2, 可得:xy20, (x10) 2(y10)2 8, 设x10t,y10t,由(x10) 2(y10)28,得 t 24,所以|xy|2|t|4. 6(2019湖南省五市十校联考)某中学奥数培训班共有 14 人,分为两个小组,在一次阶段 测试中两个小组成绩的茎叶图如图
21、所示,其中甲组学生成绩的平均数是 88,乙组学生成绩 的中位数是 89,则nm的值是_ 解析:由甲组学生成绩的平均数是 88,可得 70803903(84682m5) 7 88,解得m3.由乙组学生成绩的中位数 是 89,可得n9,所以nm6. 答案:6 9 7为了普及环保知识,增强环保意识,某大学有 300 名员工参加环保知识测试,按年龄分 组:第 1 组25,30),第 2 组30,35),第 3 组35,40),第 4 组40,45),第 5 组45, 50,得到的频率分布直方图如图所示现在要从第 1,3,4 组中用分层抽样的方法抽取 16 人,则在第 4 组中抽取的人数为_ 解析:根据
22、频率分布直方图得,第 1,3,4 组的频率之比为 143,所以用分层抽样的方 法抽取 16 人时,在第 4 组中应抽取的人数为 16 3 1436. 答案:6 8(2019成都市第二次诊断性检测)在一个容量为 5 的样本中,数据均为整数,已测出其 平均数为 10, 但墨水污损了两个数据, 其中一个数据的十位数字 1 未被污损, 即 9, 10, 11, 1 ,那么这组数据的方差s 2可能的最大值是_ 解析:由题意可设两个被污损的数据分别为 10a,b,(a,bZ Z,0a9),则 10ab 9101150,即ab10,b10a,所以s 21 5(910) 2(1010)2(1110)2 (10
23、a10) 2(b10)21 52a 2(b10)22 5(1a 2)2 5(19 2)32.8. 答案:32.8 9某校 1 200 名高三年级学生参加了一次数学测验(满分为 100 分),为了分析这次数学测 验的成绩,从这 1 200 人的数学成绩中随机抽取 200 人的成绩绘制成如下的统计表,请根据 表中提供的信息解决下列问题: 成绩分组 频数 频率 平均分 0,20) 3 0.015 16 20,40) a b 32.1 40,60) 25 0.125 55 60,80) c 0.5 74 80,100 62 0.31 88 (1)求a、b、c的值; (2)如果从这 1 200 名学生中
24、随机抽取一人, 试估计这名学生该次数学测验及格的概率P(注: 60 分及 60 分以上为及格); 10 (3)试估计这次数学测验的年级平均分 解:(1)由题意可得,b1(0.0150.1250.50.31)0.05,a2000.0510,c 2000.5100. (2)根据已知,在抽出的 200 人的数学成绩中,及格的有 162 人所以P162 200 81 1000.81. (3)这次数学测验样本的平均分为 16332.1105525741008862 200 73, 所以这次数学测验的年级平均分大约为 73 分 10 (2017 高考北京卷)某大学艺术专业 400 名学生参加某次测评, 根
25、据男女学生人数比例, 使用分层抽样的方法从中随机抽取了 100 名学生, 记录他们的分数, 将数据分成 7 组: 20, 30),30,40),80,90,并整理得到如下频率分布直方图: (1)从总体的 400 名学生中随机抽取一人,估计其分数小于 70 的概率; (2)已知样本中分数小于 40 的学生有 5 人,试估计总体中分数在区间40,50)内的人数; (3)已知样本中有一半男生的分数不小于 70, 且样本中分数不小于 70 的男女生人数相等 试 估计总体中男生和女生人数的比例 解: (1)根据频率分布直方图可知, 样本中分数不小于 70 的频率为(0.020.04)100.6, 所以样
26、本中分数小于 70 的频率为 10.60.4. 所以从总体的 400 名学生中随机抽取一人,其分数小于 70 的概率估计为 0.4. (2)根据题意,样本中分数不小于 50 的频率为 (0.010.020.040.02)100.9, 分数在区间40,50)内的人数为 1001000.955. 所以总体中分数在区间40,50)内的人数估计为 400 5 10020. (3)由题意可知,样本中分数不小于 70 的学生人数为 (0.020.04)1010060, 所以样本中分数不小于 70 的男生人数为 601 230. 所以样本中的男生人数为 30260,女生人数为 1006040,男生和女生人数
27、的比例为 11 604032. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为 32. 1(2019长春模拟)某销售公司为了解员工的月工资水平,从 1 000 位员工中随机抽取 100 位员工进行调查,得到如下的频率分布直方图: (1)试由此图估计该公司员工的月平均工资; (2)该公司的工资发放是以员工的营销水平为重要依据来确定的, 一般认为, 工资低于 4 500 元的员工属于学徒阶段,没有营销经验,若进行营销将会失败;高于 4 500 元的员工属于成 熟员工,进行营销将会成功现将该样本按照“学徒阶段工资” “成熟员工工资”分成两层, 进行分层抽样,从中抽出 5 人,在这 5 人中任
28、选 2 人进行营销活动活动中,每位员工若营 销成功,将为公司赚得 3 万元,否则公司将损失 1 万元试问在此次比赛中公司收入多少万 元的可能性最大? 解:(1)估计该公司员工的月平均工资为 0.000 11 0002 0000.000 11 0003 000 0.000 21 0004 0000.000 31 0005 0000.000 21 0006 0000.000 1 1 0007 0004 700(元) (2)抽取比为 5 100 1 20, 从工资在1 500,4 500)内的员工中抽出 100(0.10.10.2) 1 202 人,设这两位员工 分别为 1,2;从工资在4 500,
29、7 500内的员工中抽出 100(0.30.20.1) 1 203 人, 设这三位员工分别为A,B,C. 从中任选 2 人,共有以下 10 种不同的等可能结果:(1,2),(1,A),(1,B),(1,C),(2, A),(2,B),(2,C),(A,B),(A,C),(B,C) 两人营销都成功,公司收入 6 万元,有以下 3 种不同的等可能结果:(A,B),(A,C),(B, C),概率为 3 10; 其中一人营销成功,一人营销失败,公司收入 2 万元,有以下 6 种不同的等可能结果:(1, A),(1,B),(1,C),(2,A),(2,B),(2,C),概率为 6 10 3 5; 两人营
30、销都失败,公司收入2 万元,即损失 2 万元,有 1 种结果:(1,2),概率为 1 10. 12 因为 1 10 3 106.635, 可知我们在犯错误的概率不超过 0.01 的前提下,即有 99%以上的把握认为“爱好该项运动与性别有关” ,故选 C. 3(2019赣州摸底考试)在一组样本数据(x1,y1),(x2,y2),(x6,y6)的散点图中, 若所有样本点(xi,yi)(i1,2,6)都在曲线ybx 21 3附近波动经计算 6 i1xi11, 6 i1 yi13, 6 i1x 2 i21,则实数b的值为_ 14 解析:令tx 2,则曲线的回归方程变为线性的回归方程,即 ybt1 3,
31、此时 t 6 i1x 2 i 6 7 2, y 6 i1yi 6 13 6 ,代入ybt1 3,得 13 6 b7 2 1 3,解得 b5 7. 答案:5 7 4有甲、乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计后,得到 如下的列联表: 优秀 不优秀 总计 甲班 10 35 45 乙班 7 38 45 总计 17 73 90 利用列联表的独立性检验估计,则成绩与班级_(填“有关”或“无关”) 解析:成绩与班级有无关系,就是看随机变量的值与临界值 2.706 的大小关系 由公式得K 2的观测值 k90(1038735) 2 17734545 0.6532.706,所以成绩与班级
32、无关 答案:无关 5(2019广东省六校联考)某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进 行分析,规定:大于或等于 120 分为优秀,120 分以下为非优秀统计成绩后,得到如下的 列联表,且已知在甲、乙两个文科班全部 110 人中随机抽取 1 人为优秀的概率为 3 11. 优秀 非优秀 总计 甲班 10 乙班 30 总计 110 (1)请完成上面的列联表; (2)根据列联表中的数据,若按 99.9%的可靠性要求,能否认为“成绩与班级有关系” 参考公式与临界值表:K 2 n(adbc) 2 (ab)(cd)(ac)(bd). P(K 2k 0) 0.100 0.050 0.025 0
33、.010 0.001 k0 2.706 3.841 5.024 6.635 10.828 解:(1)列联表如下: 优秀 非优秀 总计 甲班 10 50 60 15 乙班 20 30 50 总计 30 80 110 (2)根据列联表中的数据,得到 K 2110(10302050) 2 60503080 7.48610.828.因此按 99.9%的可靠性要求,不能认为“成 绩与班级有关系” 6 (2019 成都市第二次诊断性检测)某项科研活动共进行了 5 次试验, 其数据如下表所示: 次数 特征量 第 1 次 第 2 次 第 3 次 第 4 次 第 5 次 x 555 559 551 563 55
34、2 y 601 605 597 599 598 (1)从特征量y的 5 次试验数据中随机地抽取两个数据,求至少有一个大于 600 的概率; (2)求特征量y关于x的线性回归方程x,并预测当特征量x为 570 时特征量y的值 分别为 解:(1)记“至少有一个大于 600”为事件A, 则P(A)1C 2 3 C 2 5 7 10. (2)由题中表格可知, 555559551563552 5 556, 601605597599598 5 600. 所以1135(5)(3)7(1)(4)(2) (1) 232(5)272(4)2 30 1000.3, 6000.3556433.2, 所以线性回归方程为
35、0.3x433.2. 当x570 时,0.3570433.2604.2 故特征量x为 570 时,特征量y的估计值为 604.2. 1(2019张掖市第一次诊断考试)中央政府为了应对因人口老龄化而造成的劳动力短缺等 问题,拟定出台“延迟退休年龄政策” 为了了解人们对“延迟退休年龄政策”的态度,责 成人社部进行调研人社部从网上年龄在 1565 岁的人群中随机调查 100 人,调查数据的 频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下: 16 年龄 15,25) 25,35) 35,45) 45,55) 55,65 支持“延迟 退休” 的人数 15 5 15 28 17 (1)由以上统
36、计数据填 22 列联表,并判断是否有 95%的把握认为以 45 岁为分界点的不同 人群对“延迟退休年龄政策”的支持度有差异; 45 岁以下 45 岁以上 总计 支持 不支持 总计 (2)若以 45 岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取 8 人参加某项 活动现从这 8 人中随机抽 2 人 ()抽到 1 人是 45 岁以下时,求抽到的另一人是 45 岁以上的概率 ()记抽到 45 岁以上的人数为X,求随机变量X的分布列及数学期望 参考数据: P(K 2k 0) 0.100 0.050 0.010 0.001 k0 2.706 3.841 6.635 10.828 K 2 n(
37、adbc) 2 (ab)(cd)(ac)(bd) 解:(1)列联表如下: 45 岁以下 45 岁以上 总计 支持 35 45 80 不支持 15 5 20 总计 50 50 100 因为K 2100(3554515) 2 50508020 25 4 6.253.841, 所以有 95%的把握认为以 45 岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差 异 (2)()抽到 1 人是 45 岁以下的概率为6 8 3 4, 抽到 1 人是 45 岁以下且另一人是 45 岁以上的 17 概率为C 1 6C 1 2 C 2 8 3 7. 故所求概率为 3 7 3 4 4 7. ()从不支持“延迟
38、退休”的人中抽取 8 人,则 45 岁以下的应抽 6 人,45 岁以上的应抽 2 人 则X0,1,2. P(X0)C 2 6 C 2 8 15 28,P(X1) C 1 6C 1 2 C 2 8 12 28 3 7, P(X2)C 2 2 C 2 8 1 28. 可得随机变量X的分布列为 X 0 1 2 P 15 28 3 7 1 28 故E(X)13 72 1 28 1 2. 2(2019广东汕头模拟)二手车经销商小王对其所经营的 A 型号二手汽车的使用年数x与 销售价格y(单位:万元/辆)进行整理,得到如下数据: 使用年数x 2 3 4 5 6 7 售价y 20 12 8 6.4 4.4
39、3 zln y 3.00 2.48 2.08 1.86 1.48 1.10 下面是z关于x的折线图: (1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用相关系数加以说明; (2)求y关于x的回归方程, 并预测某辆A型号二手车当使用年数为9年时售价约为多少; (、 小数点后保留两位有效数字) (3)基于成本的考虑,该型号二手车的售价不得低于 7 118 元,请根据(2)求出的回归方程预 测在收购该型号二手车时车辆的使用年数不得超过多少年 18 参 考 公 式 : n i1 (xi x )(y iy ) n i1 (xi x )2 n i1xiyin x y n i1x 2 in x
40、 2 , ,r n i1 (xi x )(y iy ) n i1 (xi x )2 n i1 (yi y )2 参考数据: 6 i1xiyi187.4, 6 i1xizi47.64, 6 i1x 2 i139, 6 i1 (xi x )24.18, 6 i1 (yi y )213.96, 6 i1 (zi z )21.53,ln 1.460.38,ln 0.711 80.34. 解:(1)由题意,知1 6(234567)4.5, 1 6(32.482.081.861.481.10)2, 又 6 i1xizi47.64, 6 i1 (xi x )24.18, 6 i1 (zi z )21.53,
41、 所以r47.6464.52 4.181.53 6.36 6.395 40.99, 所以z与x的相关系数大约为0.99,说明z与x的线性相关程度很高 (2)47.6464.52 13964.5 26.36 17.50.36, 所以20.364.53.62, 所以z与x的线性回归方程是0.36x3.62, 又zln y,所以y关于x的回归方程是e 0.36x3.62. 令x9,得e 0.3693.62e0.38,因为 ln 1.460.38,所以1.46,即预测某辆 A 型号二手 车当使用年数为 9 年时售价约为 1.46 万元 (3)当0.711 8,即 e 0.36x3.620.711 8eln 0.711 8e0.34时,则有0.36x3.620.34, 解得x11,因此,预测在收购该型号二手车时车辆的使用年数不得超过 11 年