1、5用样本估计总体学习目标1.学会列频率分布表,会画频率分布直方图.2.会用频率分布表或分布直方图估计总体分布,并作出合理解释.3.进一步体会用样本估计总体的思想,认识统计的实际作用,初步经历收集数据到统计数据的全过程.知识点一频率分布表1.频数与频率(1)频数:将样本数据按特征分成若干个小组,各组内数据的个数称为该组的频数.(2)频率:每组数据的个数与全体数据的个数的比值称为该组的频率.2.频率分布表为了能直观地了解样本或者总体中各事件的频率分布情况,通常我们把样本容量、样本中出现该事件的频数ni以及计算所得的相应频率fi、矩形高度(xi为小矩形的宽)列在一张表内,称为样本频率分布表,简称为频
2、率分布表.知识点二频率分布直方图1.频率分布直方图的概念将数据分组,宽度xi作小矩形的宽度,以频率与分组宽度的比为小矩形的高,将所有小矩形在同一个平面直角坐标系内画出来,所得图形称为频率分布直方图.2.绘制频率分布直方图的步骤(1)确定组距与组数组距与组数的确定没有固定的标准,常常需要一个尝试与选择的过程.组距和样本容量有关,一般样本容量越大,分的组也越多,当样本容量不超过120时,按照数据的多少,常分为512组.极差、组距、组数之间有如下关系:极差即一组数据中最大值和最小值的差.设组数k,若kZ,则组数为k;若kZ,则组数为大于k的最小整数.(2)将数据分组按组距将数据分组,分组时,各组均为
3、左闭右开区间.(3)列频率分布表(4)画频率分布直方图画图时,应以横轴表示分组,纵轴表示各组频率与组距的比值,其相应组距上的频率应该等于该组上的矩形的面积,即每个矩形的面积组距频率.3.频率分布直方图的特征(1)从频率分布直方图可以清楚地看出数据分布的总体走势;(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.思考将数据的样本进行分组的目的是什么?答案从样本中的一个数据很难看出样本所包含的信息,通过分组,并计算其频率,目的是通过描述样本数据分布的特征估计总体的分布情况.知识点三频率折线图在频率分布直方图中,按照分组原则,再在左边与右边各加一个区间,
4、从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.知识点四样本平均数与样本标准差假设通过随机抽样得到的样本为x1,x2,xn,则(x1x2xn),s分别叫作样本平均数和样本标准差,可用它们估计总体的平均数和标准差.1.频率分布直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值.()2.频率分布直方图中小长方形的面积表示该组的个体数.()3.频率分布直方图中所有小长方形面积之和为1.()4.频率分布折线图是从所加的左边区间的中点开始,用线段依次连接频率分布直方图的每个小矩形顶端中点,直到右边所加区间的中点得
5、到的.()题型一频率分布概念的理解例1一个容量为100的样本,其数据的分组与各组的频数如下:分组0,10)10,20)20,30)30,40)40,50)50,60)60,70)频数1213241516137则样本数据落在10,40)上的频率为()A.0.13 B.0.39C.0.52 D.0.64答案C解析由题意可知频数在10,40)的有13241552(个),所以频率为0.52.故选C.反思感悟(1)样本数据落在某区间上的频率为样本数据落在这个区间上的频数与样本容量的比值.(2)样本数据落在各区间上的频率之和为1.跟踪训练1容量为100的某个样本,数据拆分为10组,若前七组频率之和为0.7
6、9,而剩下的三组的频率依次相差0.05,则剩下的三组中频率最大的一组频率为_.答案0.12解析设剩下的三组中频率最大的一组的频率为x,则另两组的频率分别为x0.05,x0.1,而由频率和为1得0.79(x0.05)(x0.1)x1,解得x0.12.题型二频率分布直方图的绘制例2一个农技站为了考察某种麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.56.46.75.85.95.95.24.05.44.65.85.56.06.55.16.55.35.95.55.86.25.45.05.06.86.05.05.76.05.56.86.06.35.55.06.35
7、.26.07.06.46.45.85.95.76.86.66.06.45.77.46.05.46.56.06.85.86.36.06.35.65.36.45.76.76.25.66.06.76.76.05.66.26.15.36.26.86.64.75.75.75.85.37.06.06.05.95.46.05.26.06.35.76.86.14.55.66.36.05.86.3根据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.756.35 cm之间的麦穗所占的百分比.解(1)计算极差:7.44.03.4.(2)决定组距与组数:若取组距为0.3,因为11.3,需
8、分为12组,组数合适,所以取组距为0.3,组数为12.(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.954.25,4.254.55,4.554.85,7.257.55.(4)列频率分布表:分组频数频率3.95,4.25)10.014.25,4.55)10.014.55,4.85)20.024.85,5.15)50.055.15,5.45)110.115.45,5.75)150.155.75,6.05)280.286.05,6.35)130.136.35,6.65)110.116.65,6.95)100.106.95,7.25)20.02
9、7.25,7.55)10.01合计1001.00(5)绘制频率分布直方图如图.从表中看到,样本数据落在5.756.35之间的频率是0.280.130.41,于是可以估计,在这块试验田里长度在5.756.35 cm之间的麦穗约占41%.反思感悟绘制频率分布直方图的注意事项(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各个数据落在哪个
10、小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.跟踪训练2为了了解中学生身体发育情况,对某中学17岁的60名女生的身高(单位:cm)进行了测量,结果如下:154159166169159156166162158159156166160164160157151157161162158153158164158163158153157168162159154165166157155146151158160165158163163162161154165161162159157159149164168159153160列出样本的频率分布
11、表;绘出频率分布直方图和频率折线图.解第一步,求极差:上述60个数据中最大为169,最小为146.故极差为16914623(cm).第二步,确定组距和组数,可取组距为3 cm,则组数为7,可将全部数据分为8组.第三步,确定区间界限:145.5,148.5),148.5,151.5),151.5,154.5),154.5,157.5),157.5,160.5),160.5,163.5),163.5,166.5),166.5,169.5).第四步,列频率分布表:分组频数频率145.5,148.5)10.017148.5,151.5)30.050151.5,154.5)60.100154.5,157
12、.5)80.133157.5,160.5)180.300160.5,163.5)110.183163.5,166.5)100.167166.5,169.5)30.050合计601.000第五步,根据上述数据绘制频率分布直方图:第六步,在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,即为频率折线图.题型三频率分布直方图的应用例3为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比
13、为24171593,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少?解(1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,因此第二小组的频率为0.08.因为第二小组的频率,所以样本容量150.(2)由直方图可估计该校全体高一年级学生的达标率约为100%88%.反思感悟(1)频率分布直方图的性质因为小矩形的面积组距频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.在频率分布直方图中,各小矩形的面积之和等于1.样本
14、容量.(2)频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.跟踪训练3某校开展了一次小制作评比活动,作品上交时间为5月1日到30日.评委会把同学们上交作品的件数按5天一组分组统计,绘制了如图所示的频率分布直方图.已知从左到右各长方形的高的比为234641,第三组的频数为12,请解答下列有关问题.(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,则这两组哪组获奖率较高?解(1)依题意知,第三组的频率为0.2,又第三组的频数为12,故
15、本次活动的参评作品有60(件).(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有6018(件).(3)第四组的获奖率是.因为第六组上交的作品数量为603(件),所以第六组的获奖率为.又,显然第六组的获奖率较高.由频率分布求数据的数字特征典例从某校参加数学竞赛的试卷中抽取一个样本,考查竞赛的成绩分布,将样本分成6组,得到频率分布直方图如图,从左到右各小组的小长方形的高的比为113642,最右边的一组的频数是8.请结合直方图的信息,解答下列问题:(1)样本容量是多少?(2)成绩落在哪个范围的人数最多?并求出该小组的频数和频率.(3)估计这次数学竞赛成绩的众数、中位数和平均数.解(1
16、)从左到右各小组的频率分别为,;样本容量为68.(2)成绩落在7080之间的人数最多;频率为;频数为6824.(3)众数的估计值是75,中位数的估计值是701075.83,平均数的估计值是45556575859575.素养评析(1)利用频率分布直方图求数字特征:在频率分布直方图中,众数是最高的距形的底边的中点.在频率分布直方图中,中位数左边和右边的直方图的面积相等.平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(2)理解运算对象,掌握运算法则,求得运算结果是数学运算的核心素养.1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是(
17、)A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确答案C解析由用样本估计总体的性质可得.2.在抽查产品尺寸的过程中,将其尺寸分成若干组,a,b)是其中的一组,该组的频率为m,该组的频率分布直方图的高为h,则|ab|等于()A.hm B. C. D.hm答案B解析h,故|ab|组距.3.某校为了了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在4045 kg的人数是()A.10 B.2 C.5 D.15答案A解析由图及频率组距,知体重在4045 kg的女生的频率0
18、.0250.1.女生中体重在4045 kg的人数为0.110010.4.一个容量为20的样本数据,分组后组距与频数如下表:组距10,20)20,30)30,40)40,50)50,60)60,70)频数234542则样本在10,50)上的频率为()A.0.5 B.0.24C.0.6 D.0.7答案D解析因为样本在10,50)上的频数为234514,样本容量为20,所以在10,50)上的频率为0.7.5.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为_;(2)在这些用户中,用电量落在区间100,250)内的户数为_.答
19、案(1)0.004 4(2)70解析(1)(0.002 40.003 60.006 0x0.002 40.001 2)501,x0.004 4.(2)(0.003 60.004 40.006 0)5010070.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.2.用同样的方法先后从总体中抽取两个大小相同的样本,但两次得到的样本频率分布表、样本频率分布直方图、样本的平均数和标准差仍然可能互不相同,是样本的随机性造成的,是不可避免的.只要抽样的方法比较合理,就能反映总体的信息,当样本容量很大时,就比较接近总体的真实情况.