1、2.2 用样本估计总体2.2.1 用样本的频率分布估计总体的分布学习目标:1.理解用样本的频率分布估计总体的分布的方法(重点)2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图(难点)3.能够利用频率分布直方图和茎叶图解决实际问题(重点)自 主 预 习探 新 知1频率分布表及频率分布直方图(1)频率分布表、频率分布直方图的编制步骤计算极差(全距) ;决定组数与组距;决定分点;列频率分布表;绘制频率分布直方图(2)频率分布直方图(3)频率分布折线图、总体密度曲线频率分布折线图的定义:把频率分布直方图各个小长方形上边的中点用线段连接起来,就得到频率分布折线图总体密度曲线:如果样本容量不断
2、增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体的分布,它可以用一条光滑曲线 yf(x)来描绘,这条光滑曲线就叫做总体密度曲线思考:频率分布表与频率分布直方图各有什么特点?提示 频率分布表反映具体数据在各个不同区间的取值频率,但不直观,数据的总体态势不明显频率分布直方图能直观地表明数据分布的形状态势,但失去了原始数据2茎叶图思考:一般情况下,茎叶图中的“茎”“叶”分别指哪些数?提示 “叶 ”是数据的最后一个数字,其前面的数字作为“茎”基础自测1思考辨析(1)样本容量越大,估计的越准确( )(2)频率分布直方图的纵轴表示频率( )(3)茎叶图不能增加数据( )答案 (1) (2)
3、 (3)2一个容量为 80 的样本中,数据的最大值为 152,最小值为 60,组距为 10,应将样本数据分为( )A10 组 B9 组C8 组 D7 组A 由题意可知, 9.2,故应将数据分为 10 组152 60103从一群学生中抽取一个一定容量的样本,对他们的学习成绩进行分析已知不超过 80 分的为 10 人,其累积频率为 0.5,则样本容量是( )A20 B40C80 D60A 样本容量 20.100.54如图 221 是一个班的语文成绩的茎叶图(单位:分),则优秀率(90 分以上)是_,最低分是_5 1 56 0 3 4 4 6 7 8 8 97 3 5 5 5 6 7 98 0 2
4、3 3 5 79 1图 2214% 51 由茎叶图知,样本容量为 25,90 分以上的有 1 人,故优秀率为 4%,125最低分为 51 分合 作 探 究攻 重 难频率分布直方图的绘制探究问题1我们抽取样本的目的是什么?把抽出的样本数据做成频率分布表,需要对数据做什么工作?提示 用样本去估计总体,为决策提供依据分组、频数累计、计算频数和频率2画频率分布直方图时,如何决定组数与组距?提示 组数与样本容量大小有关,当样本容量不超过 100 时,按数据的多少,常分成 512 组,组距的选择应力求取整,一般运用“ 组数”极 差组 距3同一组数据,如果组距不同,得到的频率分布直方图相同吗?提示 不相同对
5、同一组数据,不同的组距与组数对结果有一定的影响4频率分布直方图的纵轴表示频率吗?提示 不表示 .频 率组 距某省为了了解和掌握 2018 年高考考生的实际答卷情况,随机地取出了100 名考生的数学成绩,数据如下:(单位:分)135 98 102 110 99 121 110 96 100 103125 97 117 113 110 92 102 109 104 112105 124 87 131 97 102 123 104 104 128109 123 111 103 105 92 114 108 104 102129 126 97 100 115 111 106 117 104 10911
6、1 89 110 121 80 120 121 104 108 118129 99 90 99 121 123 107 111 91 10099 101 116 97 102 108 101 95 107 101102 108 117 99 118 106 119 97 126 108123 119 98 121 101 113 102 103 104 108(1)列出频率分布表;(2)画出频率分布直方图和折线图;(3)估计该省考生数学成绩在100,120) 分之间的比例思路探究 先求极差根据极差与数据个数确定组距、组数,然后按频率分布直方图的画法绘制图形解 100 个数据中,最大值为 135
7、,最小值为 80,极差为 1358055.取组距为 5,则组数为 11.555(1)频率分布表如下:分组 频数 频率 频率/组距80,85) 1 0.01 0.00285,90) 2 0.02 0.00490,95) 4 0.04 0.00895,100) 14 0.14 0.028100,105) 24 0.24 0.048105,110) 15 0.15 0.030110,115) 12 0.12 0.024115,120) 9 0.09 0.018120,125) 11 0.11 0.022125,130) 6 0.06 0.012130,135 2 0.02 0.004合计 100 1
8、.00 0.200注:表中加上“频率/组距”一列,这是为画频率分布直方图准备的,因为它是频率分布直方图的纵坐标(2)根据频率分布表中的有关信息画出频率分布直方图及折线图,如图所示:(3)从频率分布表中可知,这 100 名考生的数学成绩在100,120)分之间的频率为0.240.150.120.090.60,据此估计该省考生数学成绩在100,120)分之间的比例为 60%.(0.6060%)规律方法 1在列频率分布表时,极差、组距、组数有如下关系:(1)若 为整数,则 组数;极 差组 距 极 差组 距(2)若 不为整数,则 的整数部分1组数极 差组 距 极 差组 距2组距和组数的确定没有固定的标
9、准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况,若样本容量不超过 100,按照数据的多少常分为 512 组,一般样本容量越大,所分组数越多母题探究:1.(变条件) 有一容量为 200 的样本,数据的分组以及各组的频数如下:20, 15),7;15,10) ,11;10,5) ,15; 5,0),40;0,5),49;5,10), 41;10,15) , 20;15,20,17.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)求样本数据不足 0 的频率解 (1)频率分布表如下:分组 频数 频率20,15)
10、7 0.03515,10) 11 0.05510,5) 15 0.0755,0) 40 0.2000,5) 49 0.2455,10) 41 0.20510,15) 20 0.10015,20 17 0.085合计 200 1.000(2)频率分布直方图和频率分布折线图如图所示:(3)样本数据不足 0 的频率为:00350.0550.0750.2000.365.2(变结论 )本例条件不变,若制成频率分布直方图时分组如下,80,85),85,90),90,95),95,100),100,105),105,110), 110,115),115,120),120,125),125,130),130,
11、135请计算该省考生数学成绩的及格率解 列出频率分布表如下:分组 频数 频率80,85) 1 0.0185,90) 2 0.0290,95) 4 0.0495,100) 14 0.14100,105) 24 0.24105,110) 15 0.15110,115) 12 0.12115,120) 9 0.09120,125) 11 0.11125,130) 6 0.06130,135 2 0.02合计 100 1.00由表可得,及格(即 90 分以上)的频率为:0040.140.240.150.120.090.110.060.020.97故及格率为 97%.频率分布直方图的应用某校在 5 月份
12、开展了科技月活动在活动中某班举行了小制作评比,规定作品上交的时间为 5 月 1 日到 31 日,逾期不得参加评比评委会把同学们上交作品的件数按 5 天一组分组统计,绘制了频率分布直方图(如图 222)已知从左到右各长方形的高的比为234641,第三组的频数为 12,请解答下列问题:图 222(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数最多,有多少件?(3)经过评比,第四组和第六组分别有 10 件、2 件作品获奖,问这两组哪组获奖率较高?【导学号:31892006】思路探究 (1)根据条件:从左到右各长方形的高的比为 234641,第三组的频数为 12,计算参加评比的作品总数;(
13、2)根据频率分布直方图判断哪组上交的作品最多,再由本组的频率计算频数;(3)先分别由第四组和第六组的频率计算该组的频数,再计算获奖率解 (1)设从左到右各长方形的高分别为 2x,3x,4x,6x,4x,x.设参加评比的作品总数为 a 件,依题意得:4x 5 ,x ,12a 35a满足(2 x3x 4x6x4xx )51.解得 a60( 件) (2)由频率分布直方图可以看出第四组上交的作品数量最多,共有6x5a 18(件)(3)第四组和第六组上交的作品数分别为:18 件,x5a3(件),则它们的获奖率分别为: ; .又 ,所以第六组的获奖率较高1018 59 23 5923规律方法 1频率分布直
14、方图的性质:(1)因为小矩形的面积组距 频率/组距频率,所以各小矩形的面积表示相应各组的频率这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小;(2)在频率分布直方图中,各小矩形的面积之和等于 1;(3)频数/相应的频率样本容量2频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性跟踪训练1某工厂对一批产品进行了抽样检测如图 223 是根据抽样检测后的产品净重(单位:克 )数据绘制的频率分布直方图,其中产品净重的范围是96,106,样本数据分组为96,98) ,98,100),100,102),102
15、,104),104,106已知样本中产品净重小于 100 克的个数是 36,则样本中净重大于或等于 98 克并且小于 104克的产品的个数是( )图 223A90 B75 C60 D45A 产品净重小于 100 克的频率为(0.0500.100)20.300,已知样本中产品净重小于 100 克的个数是 36,设样本容量为 n,则 0.300,所以 n120,净36n重大于或等于 98 克并且小于 104 克的产品的个数是 120(0.1000.1500.125)290.茎叶图及其应用某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:甲:95,81,75,91,86,89
16、,71,65,76,88,94,110,107.乙:83,86,93,99,88,103,98,114,98,79,78,106,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较思路探究 题中可用十位数字为茎,个位数字为叶作茎叶图,然后根据茎叶图分析两人成绩解 甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是 98;甲同学的得分情况,也大致对称,中位数是 88.乙同学的成绩比较稳定,总体情况比甲同学好规律方法 1绘制茎叶图关键是分清茎和叶一般地说,当数据是两位数时,十位上的数字为“茎”,个位上的数字为 “叶”;如果是小数,通常
17、把整数部分作为 “茎”,小数部分作为“ 叶” 解题时要根据数据的特点合理地选择茎和叶2应用茎叶图可以对两组数据进行比较,画图时,要找到两组数据共同的茎,分析时要从数据分布的对称性、中位数、稳定性等方面比较3茎叶图的优点是保留了原始信息,并可以随时记录数据,但当样本容量较大时就不适合了. 跟踪训练2如图 224 是 2016 年青年歌手大奖赛中七位评委为甲、乙两名选手打出的分数的茎叶图(图中 m 为数字 09 中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为 a1,a 2,则一定有( )图 224Aa 1a 2Ba 2 a1Ca 1 a2Da 1,a 2 的大小与 m
18、的值有关B 根据茎叶图可知,去掉一个最高分和一个最低分后,甲的平均分为a180 84,乙的平均分为 a280 85,故5 4 5 5 15 4 4 6 4 75a2a 1.当 堂 达 标固 双 基1一个容量为 20 的样本数据,分组及各组的频数如下:10,20),2; 20,30),3; 30,40),4;40,50),5; 50,60),4;60,70,2,则样本在区间20,60) 上的频率是( )A0.5 B0.6C0.7 D0.8D 频率 0.8.3 4 5 42 3 4 5 4 2 1620 452一个容量为 32 的样本,已知某组样本的频率为 0.125,则该组样本的频数为( )A2
19、 B4C6 D8B 频率 ,则频数频率样本容量0.125324.频 数样 本 容 量3如图 225 所示是一容量为 100 的样本的频率分布直方图,则由图中的数据可知,样本落在15,20 内的频数为( )图 225A20 B30 C40 D50B 样本数据落在15,20内的频数为:10015(0.040.10)30.4如图 226 茎叶图表示的是甲、乙两人在 5 次综合测评中的成绩,其中一个数字被污损,若乙的平均分是 89,则污损的数字是_图 2263 设污损的叶对应的成绩为 x,由茎叶图可得,895 8383 87x 9099,x3.故污损的数字是 3.5某班 50 名同学参加数学测验,成绩的分组及各组的频数如下:40,50),2; 50,60),3; 60,70),10;70,80),15 ;80,90),12;90,100,8.(1)列出样本的频率分布表;(2)画出频率分布直方图解 (1)频率分布表如下:分组 频数 频率40,50) 2 0.0450,60) 3 0.0660,70) 10 0.2070,80) 15 0.3080,90) 12 0.2490,100 8 0.16(2)频率分布直方图如下: