2019高考数学决胜专卷(含解析)之 统计初步(跟踪知识梳理)

上传人:姗*** 文档编号:71450 上传时间:2019-07-01 格式:DOCX 页数:30 大小:862.57KB
下载 相关 举报
2019高考数学决胜专卷(含解析)之  统计初步(跟踪知识梳理)_第1页
第1页 / 共30页
2019高考数学决胜专卷(含解析)之  统计初步(跟踪知识梳理)_第2页
第2页 / 共30页
2019高考数学决胜专卷(含解析)之  统计初步(跟踪知识梳理)_第3页
第3页 / 共30页
2019高考数学决胜专卷(含解析)之  统计初步(跟踪知识梳理)_第4页
第4页 / 共30页
2019高考数学决胜专卷(含解析)之  统计初步(跟踪知识梳理)_第5页
第5页 / 共30页
点击查看更多>>
资源描述

1、 统计初步跟踪知识梳理考纲解读:1.理解随机事件和概率. 2.理解概率的简单 性质. 3.了解直方图与频率分布. 4.了解总体与样本. 5.了解抽样方法. 6.了解总体均值、标准差及用样本均值、标准差估计总体均值、标准差. 考点梳理:1.总体与样本(1)总体:在统计中,所研究对象的全体. (2)个体:组成总体的每个对象. (3)样本:被抽取出来的个体的集合. (4)样本容量:样本所含个体的数目.2.抽样(1)简单随机抽样:保证总体的每个个体被抽到的机会是相同的抽样.抽签法是最常用的简单随机抽样方法. 简单随机抽样的主要步骤:编号做签;抽签得样本. (2)系统抽样:当总体所含的个体较多时, 可将

2、总体分成均衡的几个部分 ,然后按照预先定出的规则,从每一部分中抽取一定数目的个体 ,这种抽样叫做系统抽样 (或机械 抽样). 系统抽样的主要步骤:编号;分组, 确定每组的人数;规定各段抽取的个体, 得到样本. (3)分层抽样:当总体是由有明显差异的几个部分组成时, 可将总体按差异情况分成互不重叠的几个部分层, 然后按各层个体总数所占的比例来进行抽样,这种抽样叫做分层抽样.对分层抽样的每一层进行抽样时,可采用简单随机抽样或系统抽样. 分层 抽样的主要步骤: 分成互不重叠的几个部分;按各层个体总数所占的比例确定各层的样本容量; 对各层的样本进行简单随机抽样. 【说明】 (1)当总体中的个数较少时,

3、 常采取简单随机抽样 . (2)当总体中的个数较多时, 且其分布没有明显的不均匀情况,常采用系统抽样. (3)当已知总体由差异明显的几个部分组成时, 常采用分层抽样 . 3.用样本的频率分布估计总体(1)频数:各组内数据的个数. (2)频率:每组的频数与全体数据的个数之比叫做该组的频率. (3)画直方图的步骤:选择恰当的抽样方法得到样本数据;分组( 组距合适,一般分 6 到 10组);做频率分布表,表格含有分组、频数、频率这三组数据;计算频率与组距的比;画出频率分布直方图,注意直方图的横轴表示数据分组情况 ,以组距为单位 ;纵轴表示频率与组距之比. 4.用样本均值、标准差估计总体(1)样本均值

4、:如果 n 个数 x1,x2,xn,那么 = (x1+x2+xn)叫做这 n 个数的平均数或均值, 读作“x 拔”,均值反映出这组数据的平均水平 .(2)样本方差:如果样本由 n 个数 x1,x2,xn 组成, 那么样本的方差为S2= (x1- )2+(x2- )2+(xn- )2(3)样本标准差:用样本方差的算术平方根来表示个体与样本均值之间的偏离程度,叫做样本标准差,即 S=【说明】 (1)均值反映了样本和总体的平均水平, 方差和标准差则反映了样本和总体的波动大小程度.(2)通常用样本方差估计总体方差, 当样本容量接近总体容量时 ,样本方差很接近总体方差.5.变量间的相关关系(1)常见的两

5、变量之间的关系有两类:一类是函数关系, 另一类是相关关系 .与函数关系不同, 相关关系是一种非确定性关系. (2)从散点图上看, 点散布在从左下角到右上角的区域内 ,两个变量的这种相关关系称为正相关,点散布在从左上角到右下角的区域内 ,两个变量的这种相关关系称为负相关 . 6.两个变量的线性相关(1)从散点图上看, 如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫作回归直线. (2)回归方程为 ,其中 , . ybxa12nxyiaybx(3)通过求 的最小值而得出回归直线的方法, 即使得样本数据的点()1nQi到回归直线的距离的平方和

6、最小的方法叫作最小二乘法. (4)相关系数:当 r0 时,表明两个变量正相关;当 r0 时,表明两个变量正相关;当 r0 时,表明两个变量负相关. r 的绝对值越接近于 1,表明两个变量的线性相关性越强;r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关关系.通常| r|大于 0.75 时, 认为两个变量有很强的线性相关性. 7.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量 .(2)列联表:列出两个分类变量的频数表, 称为列联表.假设有两个分类变量 X 和 Y,它们的取值分别为 x1,x2和y 1,y2,其样本频数列联表(称为 22 列联

7、表) 为:y1 y2 总计x1 a b a+bx2 c d c+d总计 a+c b+d a+b+c+d构造一个随机变量 K2= , 2(-)()()nabcd其中 n=a+b+c+d 为样本容量.(3)独立性检验利用随机变量 K2 来判断“ 两个分类变量有关系”的方法称为独立性检验 .核心能力必练一、选择题1(2019 天津河东区调研)某公司有员工 500 人,其中不到 35 岁的有 125 人,3549 岁的有 280人,50 岁以上的有 95 人,为了调查员工的身体健康状况,从中抽取 100 名员工,则应在这三个年龄段分别抽取人数为( )A.33,34,33 B.25,56,19C.20,

8、40,30 D.30,50,20【答案】B【解析】因为 1258095255619,所以抽取人数分别为 25,56,19.故选 B。2(2019 新余二模)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为 100 的样本,其中城镇户籍与农村户籍各 50 人;男性 60 人,女性 40 人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示) ,其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是( )A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生

9、育二胎的人员中,农村户籍人数少于城镇户籍人数【答案】C【解析】由题图,可得是否倾向选择生育二胎与户籍有关、性别无关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中,男性人数为6060%36,女性人数为 4060%24,不相同.故选 C.3某中学领导采用系统抽样方法,从该校预备年级全体 名学生中抽 名学生做牙齿8050健康检查现将 名学生从 到 进行编 号,求得间隔数 ,即每 人抽8018016k取一个人在 中随机抽取一个数,如果抽到的是 ,则从 这 个数中应取167348的数是( )A B C D4039387【答案】B【解析】系统抽样是等距抽样,从 这 个

10、数中应取的数是 .故选 B.416391624下面的茎叶图表示连续多天同一路口同一时段通过车辆的数目,则这些车辆数的中位数和众数分别是( )A. 230.5,220 B.231.5,232 C.231,231 D.232,231【答案】C【解析】由题图得,连续多天同一路口同一时段通过车辆的数目分别为,中位数为 ,众数为 ,故选210,214,321,36,248231C.5某校高三年级有 1000 名学生,随机编号为 0001,0002, ,1000,现按系统抽样方法,从中抽出 200 人,若 0122 号被抽到了,则下列编号也被抽到的是( )A. 0927 B. 0834 C. 0726 D

11、. 0116【答案】A【解析】系统抽样是等距抽样,组距是 , ,是 的倍数,102509712805故选 A.6某班对一次实验成绩进行分析,利用随机数表法抽取样本时,先将 50 个同学按01, 02, 03,50 进行编号,然后从随机数表第 9 行第 11 列的数开始向右读,则选出的第 7 个个体是( )(注:表为随机数表的第 8 行和第 9 行)A. 02 B. 13 C. 42 D. 44【答案】A【解析】由题意得,符合条件的是 42,07,44 ,38,15,13,02 ,故选 A.7通过随机询问 110 名性别不同的大学生是否爱好某处运动,得到如下的列联表:由卡方公式算得: .278k

12、附表:参照附表:得到的正确的结论是( )A. 在犯错的概率不超过 0.1%的前提下,认为“爱好该运动与性别无关 ”B. 在犯错的概率不超过 0.1%的前提下,认为“爱好该运动与性别有关”C. 有 99%以上的把握认为 “爱好该运动与性别有关 ”D. 有 99%以上的把握认为 “爱好该运动与性别无关 ”【答案】C【解析】由 知, 有 以上的把握认为“爱好该项运动与性别有关”. 故选 C.7.86359%8某工厂生产某种产品的产量 (吨)与相应的生产能耗 (吨标准煤) 有如下几组样本数据:xyx3 4 5 6y2.5 3 4 4.5据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得

13、其回归直线的斜率为 0.7,则这组样本数据的回归直线方程是( )A B 0.725yx0.71yxC. D345【答案】C【解析】设回归直线方程为 ,由样本数据可得, .因为回归直0.7yxa4.5,3xy线经过点 ,所以 ,解得 .故选 C.,xy3.54039某班 名学生在一次考试中数学成绩的频率分布直方图如图,若在这 名学生中,数m m学成绩不低于 100 分的人数为 33,则 m等于( )A45 B48 C. 50 D55来源: 学*【答案】D【解析】 ,由 ,得 ,故选 D.10.5.210.6P.3m510某公司甲、乙、丙、丁四个地区分别有 150 个、120 个、180 个、15

14、0 个销售点.公司为了调查产品销售的情况,需从这 600 个销售点中抽取一个容量为 100 的样本,记这项调查为;在丙地区中有 20 个特大型销售点,要从中抽取 7 个调查其收入和售后服务等情况,记这项调查为,则完成、这两项调查宜采用的抽样方法依次是( )A分层抽样法,系统抽样法 B分层抽样法,简单随机抽样法C系统抽样法,分层抽样法 D简单随机抽样法,分层抽样【答案】B【解析】根据定义可得、这两项调查宜采用的抽样方法依次是分层抽样法,简单随机抽样法,故选 B.11某地区 年至 年农村居民家庭人均纯收入 (单位:千元)的数据如下表:2016y年份 2010 2011 2012来源:ZXXK 20

15、13 2014 2015 2016年份代号 t1 2 3 4 5 6 7人均纯收入 y2.9来源 :学+科+网 Z+X+X+K 3.3 3.6 4.4 4.8 5.2 5.9若 关于 的线性回归方程为 ,据此该地区 2017 年农村居民家庭人均纯收入yt0.5ta约为( )A6.3 千元 B7.5 千元 C6.7 千元 D7.8 千元【答案】A【解析】 ,1(234567)47t, ,.982.93y a4.3052.3ybt则回归方程为 将 年的年份代号 代入回归方程,得0ty018t,故预测该地区 年的农村居民家庭人均纯收 入为 6.3 千元. 故0.582.36y2017选 A12某班主

16、任对全班 50 名学生进行了作业量调查,数据如下表:认为作业多 认为作业不多 总数喜欢玩电脑游戏 18 9 27不喜欢玩电脑游戏 8 15 23总数 26 24 50根据表中数据得到 ,因为 ,则2250(19)5.07346K0(5.24).05Pk认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( )A B C D无充分根据97.5%959%【答案】A【解析】 , ,认为喜欢玩电脑游戏与认为作业量2.0K0(.24).05Pk的多少有关系的把握大约为 故选 A19713某单位为了解用电量 度与气温 之间的关系,随机统计了某 4 天的用电量与当天yCx气温,并制作了对照表,如下表,由表

17、中数据得回归直线方程 中 ,预测ybxa3当气温为 时,用电量的度数是( )2C气温( )20 16 12 4用电量(度) 14 28 44 62A70 B68 C. 64 D62【答案】A【解析】由题意,得 , ,代入回归直201643x1428637y线方程,得 ,所以 ,所以 ,当 时,37a77x,故选 A260y14从甲、乙两个城市分别随机抽取 14 台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图) ,设甲、乙两组数据的平均数分别为 ,中位数分别为 ,,x甲 乙 ,m乙甲则( )A B ,xm甲 乙 甲 乙 ,xm甲 乙 甲 乙C D甲 乙 甲 乙 甲 乙 甲 乙【答案

18、】A【解析】由题中茎叶图可得,561041825308413870x 甲,81221乙 23.5甲m, ,故 ,故选 A23乙m,xm甲 乙 甲 乙15一组数据中的每一个数据都乘 2,再减去 80,得到一组新数据,若求得新数据的平均数是 1.2,方差是 4.4,则原来数据的平均数和方差分别是( )A40.6,1.1 B48.8,4.4 C 81.2,44.4 D78.8,75.6【答案】A【解析】设原来的一组数据是 ,因为每一个数据乘以 ,再减去 得到的新12,nx 280数据的平均数是 ,方差是 ,所以 ,1.24.12(80)()()1.2nxx所以 ,所以 ,因为数据减1nx .14.6

19、x去同一个数,没有改变数据的离散程度,所以 的方差为 ,从而原来数12,n据 的方差为 ,故选 A12,nx 214.16某公司 10 位员工的月工资(单位:元)为 x1,x 2, ,x 10,其均值和方差分别为 和x,若从下月起每位员工的月工资增加 100 元,则这 10 位员工下月工资的均值和方差分2s别为( )A , +1002 B +100, +1002 xsxsC , D +100,x2sx2s【答案】D【解析】均值为 ,121012101000xxxx 方差为 2 2 21 100xxxs 17为了解某地将参加 2017 年夏令营的 名学生的身体健康情况,将学生编号为4,采用系统抽

20、样的方法抽取一个容量为 的样本,且抽到的最小号码为01,2.,40 0,已知这 名学生分住在三个营区,从 到 在第一营区,从 到 在第5 151562二营区,从 到 在第三营区,则第一、第二、第三营区被抽中的人数分别为( 6)A B C D15,01,0415,416,95【答案】B【解析】依题意可知,在随机抽样中,首次抽到 005 号,以后每隔 10 个号抽到一个人,抽取的号码构成以 5 为首项, d=10 为公差的等差数列, 105na由 解得 n16,即第一营区抽中的人数为 16 人10n由 ,得 n=17,18,26,共有 人,即第二营区抽中的562267人数为 10 人则第三营区的人

21、数为 人.4016418利用计算机产生 120 个随机正整数,其最高位数字(如:34 的最高位数字为 3,567的最高位数字为 5)的频数分布图如图所示,从这 120 个正整数中任意取出一个,设其最高位数字为 的概率为 .下列选项中,最能反映 与 的关系的是( 1 29d, , , PPd)A B C D1lgPd12Pd2510dP3152dP【答案】A【解析】由题图可知 是 的减函数,所以排除 C; ,对选项()2(9)1A,B ,D 进行验证:对于 , ;1lgPd 2310()2(9)lglg9PP 对于 , ;214 对于 , ,故选 A.315dP9()32()2(9)15P二、填

22、空题19某中学为了解学生的数学学习情况,在 3000 名学生中随机抽取 200 名,并统计这 200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图) ,根据频率分布直方图,推测这 3000 名学生在该次数学考试中成绩小于 60 分的学生数是 【答案】 60【解析】根据题中频率分布直方图,得在该次数学考试中成绩小于 分的频率是60(.212),所以在该次数学考试中成绩小于 分的学生人数为 人10603.2020某小区 45 户住户 5 月的电费(单位:元)的茎叶图如图所示,若将该小区住户按电费数额由低到高编为 1-45 号,用系统抽样的方法从中抽取 9 户,则这 9 户中电费在内的住

23、户数是 1,4【答案】 5【解析】系统抽样是等距抽样, ,在 中的数据共有5941,4个, .24876521某校从参加高一年级期中考试的学生中随机抽取 60 名学生,将其数学成绩(均为整数)分成六段40,50),50,60),90 ,100后得到如图所示的部分频率分布直方图 .观察图形的信息,则70,80)段有 名学生.来源:【答案】18【解析】由频率分布直方图可知70,80)段的频率为,所以对应的人数为 .10.5.102.5.360.31822下面茎叶图记录了甲、乙两组各 5 名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为 l5,乙组数据的平均数 为 16.8,则 的

24、值为 xy【答案】13【解析】由甲的中位数为 15 可得 ,由乙的平均数为 16.8 可得5x, .915824106.8,y13y23为了解某班学生喜欢打篮球是否与性别有关,对本班 50 人进行了问卷调查得到了下表:喜爱打篮球 不喜爱打篮球 合计男生 20 5 25女生 10 15 25合计 30 20 50下面的临界值表供参考: 20PKk0.15 0.10 0.05 0.025 0.010 0.005 0.00102.072 2.706 3.841 5.024 6.635 7.879 10.828则根据以下参考公式可得随机变量 的值为_(保留三位小数) ,有2K_%的把握认为喜爱打篮球与

25、性别有关 (参考公式:,其中 )22nadbcKdnabcd【答案】 ;8.39.5【解析】观测值 ,因为 ,所以有2021508.33k.37.89的把握认为喜爱打篮球与性别有 关.9.5%24已知 与 之间的一组数据,如下表:xyx01m43y5.7根据数据可求得 关于 的线性回归方程为 ,则 的值为 . yx8.012xm【答案】 21【解析】由题意得, , ,把0143mx35.71.44y代入回归直线方程 ,得 ,5.(1,)4m8.02xy12.()0.85m解得 .2三、解答题25食品添加剂会引起血脂增高、血压增高、血糖增高等疾病,为了解三高疾病是否与性别有关,医院随机对入院的

26、60 人进行了问卷调查,得到了如下的列联表:(1 )请将列联表补充完整,若用分层抽样的方法在患三高疾病的人群中抽 9 人,其中女性抽几人?患三高疾病 不患三高疾病 合计男 6 30女合计 36(2 )为了研究三高疾病是否与性别有关,请计算出统计量 ,并说明你有多大把握认为2K患三高疾病与性别有关.下列的临界值表供参考: 20PKk0.15 0.10 0.05 0.025 0.010 0.005 0.00102.072 2.706 3.841 5.024 6.635 7.879 10.828(参考公式: )22nadbcd【答案】 (1)3 (2 )有 99.5%的把握认为患三高疾病与性别有关【

27、解析】 (1)患三高疾病 不患三高疾病 合计男 24 6 30女 12 18 30合计 36 24 60在患三高疾病人群中抽 9 人,则女性应该抽取人数为 . 1234(2 ) ,22604186107.893K我们有 99.5%的把握认为患三高疾病与性别有关 . 26某城市 户居民的月平均用电量(单位:度) ,以 , ,10 160,8,20, , , , 分组的频率分布直方图2,2,40,26,823如图所示求直方图中 的值;1x求月平均用电量的众数和中位数;2在月平均用电量为 , , , 的四组用户中,320,4,260,820,3用分层抽样的方法抽取 户居民,则月平均用电量在 的用户中

28、应抽取多少户?14【答案】(1)0.0075 (2)众数 230,中位数 224 (3)5【解析】(1)由直方图的性质可得(0.002 0.00950.0110.0125 0.005 0.0025)x20 1,解得 0.0075,所以直方图中 的值是 0.0075. xx(2)月平均用电量的众数是 230. 204因为(0.0020.00950.011)200.450.5,所以月平均用电量的中位数在220,240)内,设中位数为 a,由(0.0020.00950.011)200.0125(a220)0.5 得 a224 ,所以月平均用电量的中位数是 224. (3)月平均用电量为220,240

29、的用户有 0.01252010025 户,月平均用电量为240,260) 的用户有 0.00752010015 户,月平均用电量为260,280) 的用户有 0. 0052010010 户,月平均用电量为280,300 的用户有 0.0025201005 户, 抽取比例 ,所以月平均用电量在220,240)的用户中应抽取1250525 5 户 127为推行“ 新课堂 ”教学法,某化学老师分别用传统教学和“ 新课堂”两种不同的教学方式,在甲、乙两个平行班级进行教学实验,为了比较教学效果,期中考试后,分别从两个班级中各随机抽取 20 名学生的成绩进行统计,作出的茎叶图如图,记成绩不低于 70 分者

30、为“成绩优良”.(1 )分别计算甲、乙两班 20 个样本中,化学分数前十的平均分,并大致判断哪种教学方式的教学效果更佳;(2 )由以上统计数据填写下面 列联表,并判断能否在犯错误的概率不超过 的前2 0.5提下认为“成绩优良与教学方式有关”?甲班 乙班 总计成绩优良成绩不优良总计附: 2nadbcKnabcdcd独立性检验临界值表: 20Pk0.10.50.250.12.763.841.46.35【答案】 (1) , , “新课堂”的教学效果更佳 (2)列联表见解析,在犯错误的概8.94率不超过 的前提下认为“成绩优良与教学方式有关”05【解析】 (1)甲班化学成绩前十的平均分为; 72479

31、80158960.0x甲乙班化学成绩前十的平均分为 . 79367984x乙甲班样本中化学成绩前十的平均分远低于乙班样本中化学成绩前十的平均分,大致可以判断“新课堂” 教学方式的教学效果更佳. (2 )甲班( 方式)A乙班( 方式)B总计成绩优良 10 16 26成绩不优良 10 4 14总计 20 20 40根据 列联表中的数据,得 的观测值为 , 22K201603.956.84124k能在犯错的概率不超过 的前提下认为“ 成绩优良与教学方式有关”. 0.528某农所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了 12 月 1 日至 12 月 5日的昼

32、夜温差与实验室每天每 100 颗种子中的发芽数,得到如下资料:日期 12 月 1 日 12 月 2 日 12 月 3 日 12 月 4 日 12 月 5 日温差 ()x10 11 13 12 8发芽数 (颗)y23 25 30 26 16该农所确定的研究方案是:先从这 5 组数据中选取 2 组,用剩下的 3 组数据求回归方程,再用被选取的 2 组数据进行检验 .(1 )求选取的 2 组数据恰好是不相邻的 2 天数据的概率;(2 )若选取的是 12 月 1 日与 12 月 5 日的两组数据,请根据 12 月 2 日至 12 月 4 日的数据,求 关于 的线性回归方程 ;yxabxy(3 )若由线

33、性回归方程得到的估计数据与所选出的检验数据的误差不超过 2 颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(注: )xbyaxyxnybniiiiiinii ,)(1212 【答案】 (1) (2 ) (3)该研究所得到的线性回归方程是可靠的535y【解析】 (1)设抽到不相邻两组数据为事件 ,因为从 5 组数据中选取 2 组数据共有A种情况,每种情况是等可能出现的,其中抽到相邻两组数据的情况共有 4 种,所25C0以 ,故选取的 2 组数据恰好是不相邻的 2 天数据的概率为 .5314)(AP 53(2 ) , , .1(32)1x(25306)27y923yx, , ,9760531iiy 114ix3x则 .3,25433123 xbyaxybiii所以 关于 的线性回归方程 .yxy(3 )当 时, ,当 时,0x 2|3|,2358x,所以该研究所得到的线性回归方程是可靠的.|167|,825y

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 高中 > 高中数学 > 数学高考 > 一轮复习