2022高考数学一轮总复习课件:9.6 抽样方法与总体分布的估计

上传人:Jc 文档编号:194824 上传时间:2021-10-06 格式:PPTX 页数:51 大小:3.64MB
下载 相关 举报
2022高考数学一轮总复习课件:9.6 抽样方法与总体分布的估计_第1页
第1页 / 共51页
2022高考数学一轮总复习课件:9.6 抽样方法与总体分布的估计_第2页
第2页 / 共51页
2022高考数学一轮总复习课件:9.6 抽样方法与总体分布的估计_第3页
第3页 / 共51页
2022高考数学一轮总复习课件:9.6 抽样方法与总体分布的估计_第4页
第4页 / 共51页
2022高考数学一轮总复习课件:9.6 抽样方法与总体分布的估计_第5页
第5页 / 共51页
点击查看更多>>
资源描述

1、96 抽样方法与总体分布的估计抽样方法与总体分布的估计 【教材梳理】 1简单随机抽样 (1)简单随机抽样:一般地,设一个总体含有 N 个个体,从中逐个_地抽取 n 个个体作 为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会_,就把这种抽样方法叫 做简单随机抽样 (2)最常用的简单随机抽样方法有两种:_法和_法 抽签法(抓阄法):一般地,抽签法就是把总体中的 N 个个体_,把号码写在号签上, 将号签放在一个容器中,搅拌均匀后,每次从中抽取_个号签,连续抽取_次,就得 到一个容量为 n 的样本 随机数法: 随机数法就是利用_、 随机数骰子或计算机产生的随机数进行抽样 简单随机抽样有操作简

2、便易行的优点,在总体个数不多的情况下是行之有效的 2分层抽样 (1)分层抽样的概念:一般地,在抽样时,将总体分成_的层,然后按照一定的_,从各层独 立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样 (2)当总体是由_的几个部分组成时,往往选用分层抽样的方法 (3)分层抽样时,每个个体被抽到的机会是_的 3用样本的频率分布估计总体分布 (1)通常我们对总体作出的估计一般分成两种:一种是用样本的_估计总体的_;另一种 是用样本的_估计总体的_ (2)在频率分布直方图中,纵轴表示_,数据落在各小组内的频率用_表示各小长 方形的面积总和等于_ (3)连接频率分布直方

3、图中各小长方形上端的中点,就得到频率分布_随着样本容量的增加,作图 时所分的_增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称之为 _,它能够更加精细地反映出_ (4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以_,而且可以 _,给数据的记录和表示都带来方便 4用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数_的数据叫做这组数据的众数 中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或者最中间两个数据的 _)叫做这组数据的中位数 平均数:样本数据的算术平均数,即 x _ 在频率分布直方图中,中位数左边和右

4、边的直方图的面积应该_ (2)样本方差、样本标准差 标 准 差s 1 n(x1 x )2(x2 x )2(xn x )2 , 其 中xn是 _,n 是_, x 是_标准差是反映总体_的特征数, 样本方差是样本标准差的_通常用样本方差估计总体方差,当样本容量接近总体容量 时,样本方差很接近总体方差 【常用结论】 5抽样方法中的几个结论 (1)不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的 (2)分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比 6频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数 (2)中位数左边和右边的小长方形的面积

5、和是相等的 (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面 积乘以小长方形底边中点的横坐标之和 7若数据 x1,x2,xn的平均数为x,方差为 s2,则数据 mx1a,mx2a, mxna 的平均数为 mxa,方差为 m2s2 【自查自纠】 1(1)不放回 都相等 (2)抽签 随机数 编号 1 n 随机数表 2(1)互不交叉 比例 (2)差异明显 (3)均等 3(1)频率分布 分布 数字特征 数字特征 (2)频率 组距 各小长方形的面积 1 (3)折线图 组数 总体密度曲线 总体在各个范围内取值的百分比 (4)保留所有信息 随时记录 4(1)最多 平均数 1 n(

6、x1x2xn) 相等 (2)样本数据的第 n 项 样本容量 平均数 波动大小 平方 判断下列命题是否正确,正确的在括号内画“”,错误的画“” (1)简单随机抽样每个个体被抽到的机会不一样,与先后有关 ( ) (2)在分层抽样中,每个个体被抽到的可能性与层数及分层有关 ( ) (3)一组数据的方差越大,说明这组数据越集中 ( ) (4)一组数据的众数可以是一个或几个,中位数也具有相同的结论 ( ) (5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数 ( ) 解:(1); (2); (3); (4); (5) 总体由编号为 00,01,02,48,49 的 50 个个体组成,利用下面的

7、随机数表选取 8 个个体, 选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字, 则选出的第 4 个个体的编号 为( ) 附:第 6 行至第 9 行的随机数表如下 2635 7900 3370 9160 1620 3882 7757 4950 3211 4919 7306 4916 7677 8733 9974 6732 2748 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 A3 B16 C38 D49 解: 从随机数表第 6 行的第 9 列和第 10 列数字开始

8、由左到右依次选取两个 数字,列举出选出来编号在 0049 的前 4 个个体的编号为 33,16,20,38, 所以选出来的第 4 个个体的编号为 38故选 C (2020全国卷)设一组样本数据 x1,x2,xn的方差为 001,则数据 10 x1,10 x2, 10 xn的方差为( ) A001 B01 C1 D10 解:因为数据 axib(i1,2,n)的方差是数据 xi(i1,2,n)的方差的 a2倍,所以所求数据方差为 1020011故选 C (2019全国卷)西游记 三国演义 水浒传和红楼梦是中国古典文学瑰宝, 并称为中国古典小说四大名著某中学为了解本校学生阅读四大名著的情况, 随机调

9、查了 100 位学生,其中阅读过西游记或红楼梦的学生共有 90 位,阅读过红楼梦的学生共 有 80 位,阅读过西游记且阅读过红楼梦的学生共有 60 位,则该校阅读过西游记 的学生人数与该校学生总数比值的估计值为( ) A05 B06 C07 D08 解:作出 Venn 图如图,由图知样本中阅读过西游记的学生人数为 70由 样本估计总体,知所求为 70 10007故选 C (2020天津卷)从一批零件中抽取 80 个,测量其直径(单位:mm),将所得数据分为 9 组:531,533),533,535),545,547),547,549,并整理得 到如下频率分布直方图,则在被抽取的零件中,直径落在

10、区间543,547)内的个数为 _ 解:根据直方图,直径落在区间543,547)内的零件频率为(625 500)0020225, 则区间543, 547)内零件的个数为 800225 18故填 18 考点一考点一 简单随机抽样与分层抽样简单随机抽样与分层抽样 (1)为考察某企业生产的袋装牛奶的质量是否达标, 现从 500 袋牛奶中抽取 6 袋进行检验, 利用 随机数表法抽取样本时,先将 500 袋牛奶按 000,001,499 进行编号,使用下面随机数表中各个 5 位数组的后 3 位,选定第 7 行第 5 组数开始,取出 047 作为抽取的第 1 袋进行检验,继续向右读,随后 检验的 5 袋牛

11、奶的号码是(下面摘取了某随机数表第 7 行至第 9 行) ( ) 84421 75331 57245 50688 77047 44767 21763 35025 83921 20676 63016 37859 16955 56719 98105 07175 12867 35047 44395 23879 33211 A245,331,421,025,016 B025,016,105,175,395 C025,016,105,175,047 D447,176,335,025,212 解:由图表可知,依次是:767(剔除),763(剔除),025,921(剔除), 676(剔除),016,859(

12、剔除),955(剔除),719(剔除),105,175,867(剔除), 047(剔除),395故随后检验的 5 袋牛奶的号码是 025,016,105,175, 395故选 B (2)我国古代数学名著九章算术有一抽样问题:“今有北乡若干人, 西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,而 北乡需遣一百零八人,问北乡人数几何?”依分层抽样的方法,则北乡共有 _人 解:设北乡有 x 人,则108 x 300108 7 4886 912,解得 x8 100故填 8 100 【点拨】 应用随机数表法的三个关键点:一是确定以表中的哪个数(哪行哪列) 为起点,以哪个方向为读数的方向;

13、二是读数时注意结合编号特点进行读取,若编号 为两位数字,则两位两位地读取,若编号是三位数字,则三位三位地读取;三是注意 筛选,超出编号范围的不取,重复的不取分层抽样的实质为按比例抽取,当总体 由差异明显的几部分组成时,多用分层抽样解决分层抽样的关键:先确定抽样比, 然后把各层个体数乘抽样比,即得各层要抽样的个体数,常用公式:(i)抽样比 样本容量 总体容量 各层样本容量 各层总量 ;(ii)层 1 的容量:层 2 的容量:层 3 的容量样本中层 1 的 容量:样本中层 2 的容量:样本中层 3 的容量 (1)(2019日照期末)某班由 50 个编号为 01,02,03,50 的学生组成, 现在

14、要选取 8 名学生参加合唱团,选取方法是从随机数表(见下表)的第 1 行的第 11 列 开始由左到右依次选取两个数字,则该样本中选出的第 8 名同学的编号为 ( ) A20 B25 C26 D34 解:从随机数表的第 1 行的第 11 列开始由左到右依次选取两个数字, 选出来的 8 名学生的编号分别为:17,37,(93 舍去)23,(78 舍去)30,35, 20,(96 舍去)(23 舍去)(84 舍去)26,34所以样本选出来的第 8 名同学的 编号为 34故选 D (2)如图,某学校共有教师 120 人,现用分层抽样的方法从中选出一个 30 人的样本, 则其中被选出的青年女教师的人数为

15、( ) A12 B6 C4 D3 解:青年教师的人数为 12030%36 人,所以青年女教师为 12 人,故青 年女教师被选出的人数为 12 30 1203故选 D 考点二考点二 数字特征及其应用数字特征及其应用 (1)(2019全国卷)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定 该选手的成绩时,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评 分7 个有效评分与 9 个原始评分相比,不变的数字特征是 ( ) A中位数 B平均数 C方差 D极差 解:平均数可能变化,方差与极差必定变化,不变的只有中位数故选 A (2)(2019全国卷)某行业主管部门为了解本行

16、业中小企业的生产情况,随机调查了 100 个企业, 得到这些企业第一季度相对于前一年第一季度产值增长率 y 的频数分布表 y 的分 组 020, 0) 0, 020) 020, 040) 040, 060) 060, 080) 企业 数 2 24 53 14 7 ()分别估计这类企业中产值增长率不低于 40%的企业比例、产值负增长的企业比 例; ()求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间 的中点值为代表)(精确到 001) 附: 748602 解:()根据产值增长率频数分布表得,所调查的 100 个企业中产值增长率不低于 40%的企业频 率为147 100 02

17、121%,产值负增长的企业频率为 2 1000022%, 用样本频率分布估计总体分布得这类企业中产值增长率不低于 40%的企业比例为 21%,产值负增 长的企业比例为 2% ()企业产值增长率的平均数 y 1 100(0 12012403530514077)03 30%, 产值增长率的方差 s2 1 100 i1 5 ni(yi y )2 1 100(04) 22(02)224025302214 04270029 6, 所以产值增长率的标准差 s 0029 6002 74017, 所以这类企业产值增长率的平均数与标准差的估计值分别为 30%,17% 【点拨】 用样本估计总体时,样本的平均数、标

18、准差只是总 体的平均数、标准差的近似值实际应用时,需先计算样本数据 的平均数,分析平均水平,再计算方差(标准差)分析稳定情况 (1)(2019全国卷)我国高铁发展迅速,技术先进经统计,在经停某站的 高铁列车中,有 10 个车次的正点率为 097,有 20 个车次的正点率为 098,有 10 个车次的正点率为 099,则经停该站高铁列车所有车次的平均正点率的估计值为 _ 解:所求为100972009810099 40 098 故填 098 (2)(2019葫芦岛期末)若样本 x11,x21,xn1 的平均数为 10,其方差为 2, 则对于样本 2x12,2x22,2xn2,下列结论正确的是 (

19、) A平均数为 20,方差为 8 B平均数为 20,方差为 10 C平均数为 21,方差为 8 D平均数为 21,方差为 10 解:若样本 x11,x21,xn1 的平均数为 10,其方差为 2,则对于样 本 2x12,2x22,2xn2,其平均数为 21020,方差为 2228故选 A (3)(2020全国卷)在一组样本数据中,1,2,3,4 出现的频率分别为 p1,p2,p3, p4,且 i1 4 pi1,则下面四种情形中,对应样本的标准差最大的一组是 ( ) Ap1p401,p2p304 Bp1p404,p2p301 Cp1p402,p2p303 Dp1p403,p2p302 解:由所有

20、选项知,p1p4,p2p3,且 p1p205,则这组数据的均值为 p1 2p23p34p45(p1p2)25由方差的定义知,离样本均值越远的点,出现 的频率越大,则越离散,即方差越大,亦即标准差越大,故选项 B 的标准差最大 另解:也可直接求出标准差再比较大小故选 B 考点三考点三 频率分布表、频率分布直方图及其应用频率分布表、频率分布直方图及其应用 (1)(2018全国卷)某家庭记录了未使用节水龙头 50 天的日用水量数据(单位:m3)和使用了节水龙头 50 天 的日用水量数据,得到频数分布表如下: 未使用节水龙头 50 天的日用水量频数分布表 日用 水量 0,0.1) 0.1,0.2) 0

21、.2,0.3) 0.3,0.4) 0.4,0.5) 0.5,0.6) 0.6,0.7) 频数 1 3 2 4 9 26 5 使用了节水龙头 50 天的日用水量频数分布表 日用 水量 0,0.1) 0.1,0.2) 0.2,0.3) 0.3,0.4) 0.4,0.5) 0.5,0.6) 频数 1 5 13 10 16 5 ()在下图中作出使用了节水龙头 50 天的日用水量数据的频率分布直方图; ()估计该家庭使用节水龙头后,日用水量小于 035 m3的概率; ()估计该家庭使用节水龙头后,一年能节省多少水?(一年按 365 天计算,同一组中的数据 以这组数据所在区间中点的值作代表) 解:() (

22、)根据以上数据,该家庭使用水龙头后 50 天日用水量小于 035 m3的频率为 020110126012005048, 因此该家庭使用节水龙头后日用水量小于 035 m3的概率的估计值为 048 ()该家庭未使用节水龙头 50 天日用水量的平均数为 1 x 1 50(0 0510153025203540459055260655) 048 该家庭使用了节水龙头后 50 天日用水量的平均数为 2 x 1 50(005101550251303510045160555) 035 估计使用节水龙头后,一年可节省水(048035)3654745(m3) (2)(2019届重庆八中高三5月考)某种产品的质量

23、按照其质量指标值 M 进行等级划分,具体如下表 质量指标值 M M80 80M110 M110 等级 三等品 二等品 一等品 现从某企业生产的这种产品中随机抽取了 100 件作为样本,对其质量指标值 M 进行统计分析,得到如图所示的频 率分布直方图 ()记 A 表示事件“一件这种产品为二等品或一等品”,试估计事件 A 的概率; ()已知该企业的这种产品每件一等品、 二等品、 三等品的利润分别为 10 元、 6 元、 2 元, 试估计该企业销售 10000 件该产品的利润; ()根据该产品质量指标值 M 的频率分布直方图,求质量指标值 M 的中位数的估计值(精确到 001) 解:()记 B 表示

24、事件“一件这种产品为二等品”,C 表示事件“一件这 种产品为一等品”,则事件 B,C 互斥, 且由频率分布直方图估计 P(B)0203015065,P(C)01 009019, 又 P(A)P(BC)P(B)P(C)084, 所以事件 A 的概率估计为 084 另解:先由频率分布直方图估计 P(A)00601016,故 P(A)1 P(A)084 ()由()知,任取一件产品是一等品、二等品的概率估计值分别为 019,065, 故任取一件产品是三等品的概率估计值为 016 从而 10000 件产品估计有一等品、二等品、三等品分别为 1900,6500,1600 件, 故利润估计为 1900106

25、50061600261200 元 ()因为在产品质量指标值 M 的频率分布直方图中, 质量指标值 M90 的频率为 006010203605, 质量指标值 M05, 故质量指标值 M 的中位数估计值为 9005036 003 9467 【点拨】 在频率分布直方图中, 每个小矩形的面积就是相应的频率或概率, 所有小矩形的面积之和为 1,这是解题的关键,也是识图的基础准确理解频 率分布直方图的特点,频率分布直方图中纵轴上的数据是各组的频率除以组距, 不要误以为纵轴上的数据是各组的频率,不要和条形图混淆频率分布直方图 中的计算:其中众数取最高的小矩形底边中点的横坐标;求中位数,可将频率分 布直方图划

26、分为左右两个面积相等的部分, 分界线与横轴交点的横坐标即是(如先 确定中位数所在区间,利用“05较低累积频率(x区间左端点)区间纵坐 标”,求得的 x 便是) (1)如图是追踪调查 200 个某种电子元件寿命(单位: h)的频率分布直方图, 其中 300400, 400500 两组数据丢失,下面四个说法中有且只有一个与原数据相符,这个说法是 ( ) 寿命在 300400 的频数是 90; 寿命在 400500 的矩形的面积是 02; 用频率分布直方图估计电子元件的平均寿命为:15001250015350045450015550 015; 寿命超过 400 h 的频率为 03 A B C D 解

27、:若正确,则 300400 对应频率为 90 2000 45,此时 400500 对应频率为 1010152045015,即图中 2,4,5 组的 矩形应等高,矛盾,故不正确由此判断中的计算错误,同时中 的频率应大于 03,错误即错误仅正确故选 B (2)(2019北京高一期末)某市进行人口抽样调查,随机抽取了某区居民 13 289 人,记录他们的年龄,将数据分成 10 组:0,10),10,20),20,30),90,100,并整理得到如下频率分布直方图 ()从该区中随机抽取一人,估计其年龄不小于 60 的概率; ()估计该区居民年龄的中位数(精确到 01); ()假设同组中的每个数据用该组

28、区间的中点值代替,估计该区居民的平均年龄 解:()设“从该区中随机抽取一人,估计其年龄不小于 60”为事件 A 则 P(A)0125006500400050235 所以该区中随机抽取一人,估计其年龄不小于 60 的概率为 0235 ()年龄在0,40)的累计频率为 00750035016018045,在0, 50)的累计频率为 045014059, 所以中位数在40, 50), 由 005 001436, 估计该区居民年龄的中位数为 4036436 ()平均年龄为 50075150035250163501845014 5501756501257500658500495000544 所以估计该区

29、居民的平均年龄为 44 学科素养微专题 社会民生中的数据分析 (1)(2017山东卷)如图所示的茎叶图记录了甲、 乙两组各 5 名工人某日的产 量数据(单位:件) 若这两组数据的中位数相等,且平均值也相等,则 x 和 y 的值分别为_ 解:根据两组数据的中位数相等可得 6560y,解得 y5,又它们的 平均值相等,所以 56626574(70 x) 5 596167(60y)78 5 ,解得 x3故填 3;5 (2)(2018全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现 翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村 的经济收入构成比例,得到

30、如下饼图 则下面结论中不正确的是 ( ) A新农村建设后,种植收入减少 B新农村建设后,其他收入增加了一倍以上 C新农村建设后,养殖收入增加了一倍 D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 解:农村的经济收入增加了一倍,实现翻番,则 A 不正确,因为 37% 260%易知 B,C,D 均正确故选 A (3)某公司新研发了两种不同型号的平板电脑,公司统计了消费者对这两种型号平板电 脑的评分情况,统计如下图,则下列说法不正确的是( ) A甲、乙两型号的综合得分相同 B乙型号电脑的拍照功能比较好 C在性能方面,乙型号电脑做的比较好 D消费者比较喜欢乙型号电脑的屏幕 解:由雷达

31、图的数据可知,甲型号的综合得分为 9095859585450,乙型号 的综合得分为 8590909590450, 所以甲、 乙两型号的综合得分相同, 所以选项 A 正确;两种型号电脑的对比共涉及五个方面:系统评分相同、拍照功能乙型较好、外观设 计甲型较好、屏幕甲型较好、性能乙型较好综上,可知选项 B,C 正确故选 D 【点拨】 生活生产中处处有数学,高考强化数学应用,关注社会民生,统计中体现 的更为明显统计图表中除了茎叶图、散点图、频率分布直方图、折线图外,饼图、 雷达图、等高条形图、柱形图等也是近年高考热点难度不高,多与实际生活结合 紧密,考查考生阅读理解能力及数据分析核心素养,考查应用意识

32、一般只要仔细 读题、分析,即可解决 (1)某班学生 A, B 在高三 8 次月考的化学成绩用茎叶图表示如图, 其中学 生 A 的平均成绩与学生 B 的成绩的众数相等,则 m ( ) A4 B5 C6 D7 解:由题意,得73798285(80m)839293 8 84, 解得 m5故选 B (2)【多选题】设如图是 2020 年第三季度某五省 GDP 情况图,则下列陈述中正确的 是( ) A2020 年第三季度 GDP 增速由高到低排位第 5 的是 A 省 B与去年同期相比,2020 年五省第三季度的 GDP 总量实现了增长 C去年同期 C 省的 GDP 总量不超过 4 000 亿元 D202

33、0 年第三季度 GDP 总量和增速由高到低排位均居同一位的省只有 1 个 解:A,B 显然正确;4 0674 (166%)3 8156,C 正确;GDP 总 量由高到低排名:B,D,A,C,E,增速由高到低排名:B,E,D,C,A, 有 2 个 GDP 总量与增速均居同一位,D 不正确故选 ABC (3)为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计 其喜欢的支付方式,并制作出如下等高条形图: 根据图中的信息,下列结论中不正确的是 ( ) A样本中的男生数量多于女生数量 B样本中喜欢手机支付的数量多于现金支付的数量 C样本中多数男生喜欢手机支付 D样本中多数女生喜欢现金支付 解: 由左图知 A 正确, 由右图知 B, C 正确, 仅 D 的表述错误故 选 D

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 高中 > 高中数学 > 数学高考 > 一轮复习