1、第第 12 章章 统计学初步统计学初步 章末复习课章末复习课 网络构建 核心归纳 1关于抽样方法 (1)用随机数表法抽样时,对个体所编号码位数要相同,当问题所给位数不同时,以位数较多 的为准,在位数较少的数前面添“0”,凑齐位数 (2)用系统抽样法时,如果总体容量 N 能被样本容量 n 整除,则抽样间隔为 kN n;如果总体 容量 N 不能被样本容量 n 整除,则先用简单随机抽样法剔除多余个体,抽样间隔为 kK n(其 中,KN多余个体数) (3)应用三种抽样方法时需要搞清楚它们的使用原则 当总体容量较小,样本容量也较小时,可采用抽签法 当总体容量较大,样本容量较小时,可用随机数表法 当总体容
2、量较大,样本容量也较大时,可用系统抽样法 当总体由差异明显的几部分组成时,常用分层抽样法 2关于用样本估计总体 (1)用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作 频率分布表与频率分布直方图时要注意其方法步骤 (2)茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到;二是便于记录和表示 (3)均值反映了样本数据的平均水平,而标准差反映了样本数据的离散程度 3变量间的相关关系 除了函数关系这种确定性的关系外,还大量存在因变量的取值带有一定随机性的两个变量之 间的关系相关关系,对于线性相关关系,通过建立回归直线方程就可以根据其部分观测 值,获得对这两个变量之间
3、的整体关系的了解,主要是作出散点图、写出回归直线方程. 要点一 抽样方法 1抽样方法有:简单随机抽样、系统抽样、分层抽样 2三种抽样方法比较 例 1 某校选修乒乓球课程的学生中,高一年级有 30 名,高二年级有 40 名,现用分层抽样 的方法在这 70 名学生中抽取一个样本, 已知在高一年级的学生中抽取了 6 名, 则在高二年级 的学生中应抽取的人数为( ) A6B8C10D12 答案 B 解析 分层抽样的原理是按照各部分所占的比例抽取样本 设从高二年级抽取的学生数为 n, 则30 40 6 n,得 n8. 跟踪演练 1 某地区有小学 150 所,中学 75 所,大学 25 所现采用分层抽样的
4、方法从这些 学校中抽取 30 所学校对学生进行视力调查,应从小学中抽取_所学校,中学中抽取 _所学校 答案 18 9 解析 根据分层抽样的特点求解从小学中抽取 30 150 150752518 所学校;从中学中抽 取 30 75 15075259 所学校 要点二 用样本估计总体 本专题主要利用统计表、 统计图分析估计总体的分布规律 要熟练掌握绘制统计图表的方法, 明确图表中有关数据的意义是正确分析问题的关键,从图形与图表中获取有关信息并加以整 理,是近年来高考命题的热点样本的数字特征可分为两大类:一类是反映样本数据集中趋 势的,包括众数、中位数和均值;另一类是反映样本波动大小的,包括方差及标准
5、差我们 常通过样本的数字特征估计总体的数字特征 例 2 某地统计局就该地居民的月收入调查了 10000 人,并根据所得数据画出如下的样本的 频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在1000,1500). (1)求居民月收入在3000,3500)的频率; (2)根据频率分布直方图算出样本数据的中位数; (3)为了分析居民的收入与年龄、 职业等方面的关系, 必须按月收入再从这 10 000 人中用分层 抽样方法抽出 100 人作进一步分析,则月收入在2 500,3 000)的这段应抽多少人? 解 (1)月收入在3 000,3 500)的频率为 0.15. (2)0.10
6、.20.250.550.5. 设样本数据的中位数为 x,则x2000 0.50.3 25002000 0.25 , x2400,样本数据的中位数为 2400 元 (3)居民月收入在2500,3000)的频率为 0.25,所以 10000 人中月收入在2500,3000)的人数为 0.25100002500(人) 再从 10 000 人中用分层抽样方法抽出 100 人,则月收入在2500,3000)的这段应抽取 100 2500 1000025(人) 跟踪演练 2 (1)为了了解某校高三学生的视力情况,随机地抽查了该校 100 名高三学生的视 力情况, 得到频率分布直方图如下图, 由于不慎将部分
7、数据丢失, 但知道后 5 组频数和为 62, 视力在 4.6 到 4.8 之间的学生数为 a,最大频率为 0.32,则 a 的值为( ) A64B54C48D27 (2)从某项综合能力测试中抽取 100 人的成绩,统计如表,则这 100 人成绩的标准差为( ) 分数 5 4 3 2 1 人数 20 10 30 30 10 A. 3 B.2 10 5 C3 D.8 5 答案 (1)B (2)B 解析 (1)4.7,4.8)之间的频率为 0.32, 4.6,4.7)之间的频率为 10.620.050.1110.78 0.22. a(0.220.32)10054. (2) x 10040906010
8、 100 3, s21 n(x1 x ) 2(x 2 x ) 2(x n x ) 2 1 100(202 2101230121022) 160 100 8 5s 2 10 5 . 要点三 变量的相关关系 1 分析两个变量的相关关系时, 我们可根据样本数据散点图判断两个变量之间是否存在相关 关系,还可利用最小二乘法求出回归方程把样本数据表示的点在直角坐标系中作出,构成 的图叫作散点图从散点图上,我们可以分析出两个变量是否存在相关关系如果这些点大 致分 布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直 线叫作回归直线,直线方程叫作回归直线方程 2回归方程的应用:利用
9、回归方程可以对总体进行预测,虽然得到的结果不是准确值,但我 们是根据统计规律得到的,因而所得结果的正确率是最大的,所以可以大胆地利用回归方程 进行预测 例 3 某地最近十年粮食需求量逐年上升,下表是部分统计数据: 年份 2005 2007 2009 2011 2013 需求量(万吨) 236 246 257 276 286 (1)利用所给数据求年需求量 y 与年份 x 之间的回归直线方程 ybxa; (2)利用(1)中所求出的直线方程预测该地 2018 年的粮食需求量 解 (1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程为 此对数据预处理如下: 年份2009 4 2
10、 0 2 4 需求量257 21 11 0 19 29 对预处理后的数据,容易算得x 0,y 3.2, b(4)(21)(2)(11)219429 42222242 260 40 6.5,ay bx 3.2. 由上述计算结果,知所求回归直线方程为 y2576.5(x2 009)3.2, 即 y6.5(x2 009)260.2. (2)利用直线方程,可预测 2018 的粮食需求量为 65(2 0182 009)260.26.59260.2318.7319(万吨) 跟踪演练 3 为了解儿子身高与其父亲身高的关系,随机抽取 5 对父子的身高数据如下: 父亲身高 x(cm) 174 176 176 1
11、76 178 儿子身高 y(cm) 175 175 176 177 177 则 y 对 x 的线性回归方程为( ) Ayx1 Byx1 Cy881 2x Dy176 答案 C 解析 由题意得 x 174176176176178 5 176(cm), y 175175176177177 5 176(cm), 由于( x , y )一定满足线性回归方程,经验证知选 C. 要点四 数形结合思想 名称 数 形 结合 频率分布 直方图 数据分组及频数: 40,50), 2; 50,60), 3; 60,70),10;70,80), 15; 80,90), 12; 90,100, 8 可求众数:最高小 长
12、方形的中点所对应 的数据;可求中位 数:中位数左边和右 边的直方图面积相 等;可求均值:每 个小长方形的高乘以 小长方形底边中点的 横坐标之和;可求 落在各个区域内的频 率 名称 数 形 结合 茎叶图 甲的数据: 95,81,75,89,71,65,76,8 8,94; 乙的数据: 83,86,93,99,88,103,98, 114,98 茎是十位和百位数 字,叶是个位数字; 可以帮助分析样本 数据的大致频率分 布; 可用来求数据的一 些数字特征,如中位 数、众数等 散点图 n 个数据点(xi,yi) 可以判断两个变量之 间有无相关关系 例 4 甲、乙两人在相同的条件下各射靶 10 次,每次
13、射靶成绩(单位:环)如下图所示 (1)填写下表: 均值 方差 中位数 命中 9 环及以上 甲 7 1.2 1 乙 5.4 3 (2)请从四个不同的角度对这次测试进行分析: 从平均数和方差结合分析偏离程度; 从平均数和中位数结合分析谁的成绩好些; 从平均数和命中 9 环以上的次数相结合看谁的成绩好些; 从折线图上两人射击命中环数及走势分析谁更有潜力 解 (1)乙的射靶环数依次为 2,4,6,8,7,7,8,9,9,10.所以 x乙 1 10(246877899 10)7;乙的射靶环数从小到大排列为 2,4,6,7,7,8,8,9,9,10,所以中位数是78 2 7.5;甲的射 靶环数从小到大排列
14、为 5,6,6,7,7,7,7,8,8,9,所以中位数为 7.于是填充后的表格如下表所示: 均值 方差 中位数 命中 9 环及以上 甲 7 1.2 7 1 乙 7 5.4 7.5 3 (2)甲、乙的平均数相同,均为 7,但 s2甲X乙,甲比乙成绩稳定 BX甲X乙,乙比甲成绩稳定 CX甲X乙,甲比乙成绩稳定 DX甲X乙,且甲比乙成绩稳定 课堂小结 本部分内容在高考中所占比重有加大的趋势,多以选择题、填空题出现,但在某些数学试题 中也出现了解答题,但本部分的所有题目都属中、低档题,难度都不大 抽样方法始终是考查的热点,多与概率问题相结合,对频率分布直方图及相关知识的考查也 是一个热点,另外高考对样本数字特征的考查有时是单纯的考查数字特征,有时与抽样方法 和概率相结合,要加强注意