1、 5.1 5.1 总体平均数与方差的估计总体平均数与方差的估计 第第5 5章章 用样本推断总体用样本推断总体 教学目标教学目标 1. 会利用样本的平均数众数中位数方差估计总会利用样本的平均数众数中位数方差估计总 体的平均数众数中位数方差体的平均数众数中位数方差. 2.进一步体会用样本估计总体的统计思想方法进一步体会用样本估计总体的统计思想方法. 重点:重点:平均数,加权平均数平均数,加权平均数. .方差的计算方法方差的计算方法 难点:难点:在简单随机样本中,会用样本的平均数在简单随机样本中,会用样本的平均数 和方差来估计总体的平均数和方差和方差来估计总体的平均数和方差. . 新课引入新课引入
2、阅读下面的报道,回答问题阅读下面的报道,回答问题. 北京市将启动北京市将启动20122012年度人口抽样调查工作年度人口抽样调查工作 新京报讯(记者蒋彥鑫)北京市将启动新京报讯(记者蒋彥鑫)北京市将启动20122012年度人口抽样调查工作,共年度人口抽样调查工作,共12891289个个 小区纳入范畴。调查结果将作为城市规划的依据,并监测人口调控目标的实现程度。小区纳入范畴。调查结果将作为城市规划的依据,并监测人口调控目标的实现程度。 从去年起,北京每年开展年度人口抽样调查,以便掌握人口性别、年龄、就业、从去年起,北京每年开展年度人口抽样调查,以便掌握人口性别、年龄、就业、 迁移等基本变化情况,
3、及时监测人口调控目标的实现程度。市统计局表示,迁移等基本变化情况,及时监测人口调控目标的实现程度。市统计局表示,20122012年年 年度人口抽样调查涉及年度人口抽样调查涉及275275个街道和乡镇、个街道和乡镇、646646个社区居(村)委会、个社区居(村)委会、12891289年调查小年调查小 区。这些小区分布在各个区县。区。这些小区分布在各个区县。 据了解,此次抽样调查是以北京人口普查数据为基数,在每个区按照人口总量据了解,此次抽样调查是以北京人口普查数据为基数,在每个区按照人口总量 2%2%的比例进行抽样。在样本选取的过程中,选取的小区需要能在本区县人口结构、的比例进行抽样。在样本选取
4、的过程中,选取的小区需要能在本区县人口结构、 人口规模等方面都有代表性。其中,抽样的核心指标包括流动人口比重、本地区人人口规模等方面都有代表性。其中,抽样的核心指标包括流动人口比重、本地区人 口出生率和死亡率、城乡属性等口出生率和死亡率、城乡属性等 ,以确保抽取样本的科学性。,以确保抽取样本的科学性。 根据该抽样的结果,将推算出每年北京人口总量以及增长的情况。该结果可以根据该抽样的结果,将推算出每年北京人口总量以及增长的情况。该结果可以 及时反映北京人口调控目标的实现情况,人口增长的特点等,并作为今后城市规划、及时反映北京人口调控目标的实现情况,人口增长的特点等,并作为今后城市规划、 各项政策
5、颁布实施和人口调控的重要依据。各项政策颁布实施和人口调控的重要依据。 从上述报道可见,北京市统从上述报道可见,北京市统 计局进行计局进行20122012年度人口调查采用年度人口调查采用 的是什么调查方式的是什么调查方式? ? 我们在研究某个总体时,一般用数据表示我们在研究某个总体时,一般用数据表示 总体中每个个体的某种数量特性,所以这些数总体中每个个体的某种数量特性,所以这些数 据组成一个总体,而样本则是从总体中抽取的据组成一个总体,而样本则是从总体中抽取的 部分数据,因此,样本蕴含着总体的许多信息,部分数据,因此,样本蕴含着总体的许多信息, 这使得我们有可能通过样本的某些特性去推断这使得我们
6、有可能通过样本的某些特性去推断 总体的相应特性总体的相应特性. . 从总体中抽取样本,然后通过对样本的分从总体中抽取样本,然后通过对样本的分 析,去推断总体的情况,这是析,去推断总体的情况,这是统计的基本思想统计的基本思想. . 用样本平均数、样本方差分别去估计总体平均用样本平均数、样本方差分别去估计总体平均 数、总体方差就是这一思想的一个体现数、总体方差就是这一思想的一个体现. .实践实践 和理论都表明:在大多数情况下,当和理论都表明:在大多数情况下,当样本容量样本容量 足够大足够大时,这种估计是比较合理的时,这种估计是比较合理的. . (1 1)如何估计某城市所有家庭一年内平)如何估计某城
7、市所有家庭一年内平 均丢弃的塑料袋个数?均丢弃的塑料袋个数? (2 2)在检查甲、乙两种棉花的纤维长度)在检查甲、乙两种棉花的纤维长度 时,如何估计哪种棉花的纤维长度比较整时,如何估计哪种棉花的纤维长度比较整 齐?齐? 可以进行简单随机抽样,可以进行简单随机抽样, 然后用样本去推断总体然后用样本去推断总体. 由于简单随机样本客观地反映了实际情况,能够代表总体,由于简单随机样本客观地反映了实际情况,能够代表总体, 因此我们可用简单随机样本的平均数与方差分别去估计总因此我们可用简单随机样本的平均数与方差分别去估计总 体的平均数与方差体的平均数与方差. . 例如:我们可以从某城市所有家庭中抽取一部分
8、家庭,统例如:我们可以从某城市所有家庭中抽取一部分家庭,统 计他们在一年内丢弃的塑料袋个数,然后求出它们的平均计他们在一年内丢弃的塑料袋个数,然后求出它们的平均 值,再用这个平均值去估计该城市所有家庭一年内平均丢值,再用这个平均值去估计该城市所有家庭一年内平均丢 弃的塑料袋个数弃的塑料袋个数. .同样,我们可以从甲、乙两种棉花中各同样,我们可以从甲、乙两种棉花中各 抽取一定量的棉花,分别统计它们的纤维长度的方差,再抽取一定量的棉花,分别统计它们的纤维长度的方差,再 用这两个方差分别去估计这两种棉花纤维长度的整齐性,用这两个方差分别去估计这两种棉花纤维长度的整齐性, 方差小的棉花品种整齐性较好方
9、差小的棉花品种整齐性较好. . 某农科院在某地区选择了自然条件相同的两某农科院在某地区选择了自然条件相同的两 个试验区,用相同的管理技术试种甲、乙两个品个试验区,用相同的管理技术试种甲、乙两个品 种的水稻各种的水稻各100 100 亩亩. . 如何确定哪个品种的水稻在如何确定哪个品种的水稻在 该地区更有推广价值呢?该地区更有推广价值呢? 为了选择合适的稻种,我们需要关心这两种水稻的为了选择合适的稻种,我们需要关心这两种水稻的 平均产量及产量的稳定性(即方差)平均产量及产量的稳定性(即方差). .于是,待水稻成熟于是,待水稻成熟 后,各自从这后,各自从这100 100 亩水稻随机抽取亩水稻随机抽
10、取10 10 亩水稻,记录它们亩水稻,记录它们 的亩产量(样本),数据如下表所示:的亩产量(样本),数据如下表所示: 种类 种类 每亩每亩水稻的产量(水稻的产量(kg) 甲甲 865 885 886 876 893 885 870 905 890 895 乙乙 870 875 884 885 886 888 882 890 895 896 这这1010亩甲、乙品种的水稻的平均产量分别为:亩甲、乙品种的水稻的平均产量分别为: = = (865 + 885 + 886 + 876 + 893 + 885 + 870 + 905 + 890 + 895865 + 885 + 886 + 876 +
11、893 + 885 + 870 + 905 + 890 + 895)= 885= 885, 甲 x _ 10 1 乙 x _ = = (870 + 875 + 884 + 885 + 886 + 888 + 882 + 890 + 895 + 896870 + 875 + 884 + 885 + 886 + 888 + 882 + 890 + 895 + 896)= 885.1.= 885.1. 10 1 由于这由于这1010亩水稻是简单随机抽取的,因此可以分别用这亩水稻是简单随机抽取的,因此可以分别用这1010亩水稻的平均亩水稻的平均 产量去估计这两种水稻大面积种植后的平均产量产量去估计这两种水稻大面积种植后的平均产量. . 利用计算器,我们可计算出这利用计算器,我们可计算出这10 10 亩甲、乙品种水稻产量的方差分别为亩甲、乙品种水稻产量的方差分别为 129.6129.6,59.09. 59.09. 由于由于59.09129.659.09129.6,即,即 . s 乙 2. 乙山上的杨梅产量较稳定 对总体 的研究 数据较数据较 少时直少时直 接研究接研究 数据较数据较 多时抽多时抽 样研究样研究 抽样 方法 总体 估计 总体平均 数估计 数据方 差估计 通过本小节,你有通过本小节,你有什么什么收获?收获? 你还存在哪些疑问,和同伴交流。你还存在哪些疑问,和同伴交流。