2021年高考数学考前30天回归课本知识技法精细过(十五)随机抽样与统计

上传人:争先 文档编号:181557 上传时间:2021-05-08 格式:DOCX 页数:6 大小:36.02KB
下载 相关 举报
2021年高考数学考前30天回归课本知识技法精细过(十五)随机抽样与统计_第1页
第1页 / 共6页
2021年高考数学考前30天回归课本知识技法精细过(十五)随机抽样与统计_第2页
第2页 / 共6页
2021年高考数学考前30天回归课本知识技法精细过(十五)随机抽样与统计_第3页
第3页 / 共6页
2021年高考数学考前30天回归课本知识技法精细过(十五)随机抽样与统计_第4页
第4页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、高考数学考前高考数学考前 30 天回归课本知识技法精细过(十五天回归课本知识技法精细过(十五) 第第一一节节 随机抽样随机抽样 一、必记 3 个知识点 1简单随机抽样 (1)简单随机抽样:一般地,设一个总体含有 N 个个体,从中逐个_地抽取 n 个个体作为样本 (nN), 如果每次抽取时总体内的各个个体被抽到的机会_, 就把这种抽样方法叫做简单随机抽样 (2)最常用的简单随机抽样方法有两种_法和_法 (3)一般地,抽签法就是总体中的 N 个个体编号,把号码写在号签上,将号签放在一个容器中, _后,每次从中抽取一个号签,连续抽取 n 次,就得到一个容量为 n 的样本 (4)随机数表法就是利用随机

2、数表、随机数骰子或计算机产生的随机数进行抽样 (5)简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的 2系统抽样 (1)一般地,假设要从容量为 N 的总体中抽取容量为 n 的样本,我们可以按下列步骤进行系统抽样: ()先将总体的 N 个个体编号有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等; ()确定分段间隔 k,对编号进行分段当N n(n 是样本容量)是整数时,取 k_; ()在第 1 段用_确定第一个个体编号 l(lk); ()按照一定的规则抽取样本通常是将 l_得到第 2 个个体编号(lk),再加 k 得到第 3 个个 体编号_,依次进行下去,直到获取整

3、个样本 (2)当总体中元素个数较少时,常采用简单随机抽样,当总体中元素个数较多时,常采用_. 3分层抽样 (1)分层抽样的概念:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独 立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样 (2)当总体是由_的几个部分组成时,往往选用分层抽样的方法 (3)分层抽样时,每个个体被抽到的机会是_的 二、必明 2 个易误点 1认清简单随机抽样、系统抽样、分层抽样三者间的区别与联系,是正确选择抽样方法的前提 2在系统抽样中,应先确定分段间隔,然后再确定入样个体编号间的关系 三、技法 1. 解决简单随机抽样应

4、注意的问题 (1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀一般地,当 总体容量和样本容量都较小时可用抽签法 (2)在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每 三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去. 2. 系统抽样应注意的问题 系统抽样又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第 1 组所抽 取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码 系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽样从总体

5、中剔除几个 个体,然后再按系统抽样进行. 参考答案 不放回 都相等 抽签 随机数表 搅拌均匀 N n 简单随机抽样 加上间隔 k (l2k) 系统抽样 差异明显 均等 第第二二节节 用样本估计总体用样本估计总体 一、必记 3 个知识点 1频率分布直方图 (1)通常我们对总体作出的估计一般分成两种一种是用样本的_估计总体的分布另一种是 用样本的_估计总体的数字特征 (2)在频率分布直方图中,纵轴表示_,数据落在各小组内的频率用各小长方形的_ 表示各小长方形的面积总和_. (3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图随着_的增加, 作图时所分的_增加,相应的频率分布折线图就

6、会越来越接近于一条光滑的曲线,统计中称之为 _,它能够更加精细地反映出总体在各个范围内取值的_. (4)当样本数据较少时, 用茎叶图表示数据的效果较好, 它不但可以保留所有信息, 而且可以随时记录, 给数据的记录和表示都带来方便 2众数,中位数,平均数 (1)众数:在一组数据中,出现次数_的数据叫做这组数据的众数 (2)中位数:将一组数据按大小依次排列,把处在_位置的一个数据(或最中间两个数据的平均 数)叫做这组数据的_. (3)平均数:样本数据的算术平均数即 x _.在频率分布直方图中,中位数左边和右边的 直方图的面积应该_. 3样本方差,标准差 标准差 s 1 nx1 x 2x 2 x 2

7、x n x 2, 其中 xn是样本数据的第 n 项,n 是样本容量, x 是_.标准差是反映总体波动大小的特征数, 样本方差是标准差的平方通常用样本方差估计总体方差,当样本容量_总体容量时,样本方差 越接近总体方差 二、必明 1 个易误点 不要把直方图错认为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直 方图是连续随机变量,纵坐标刻度为频率/组距,连续随机变量在某一点上是没有频率的 三、技法 1. 众数、中位数、平均数及方差的意义及计算公式 (1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述数据 集中趋势,方差和标准差描述波动的大小

8、 (2)平均数、方差的公式推广 若数据 x1,x2,xn的平均数为 x ,那么 mx1a,mx2a,mx3a,mxna 的平均数是 m x a. 数据 x1,x2,xn的方差为 s2. ()数据 x1a,x2a,xna 的方差也为 s2; ()数据 ax1,ax2,axn的方差为 a2s2. (3)方差的简化计算公式 s21 n(x 2 1x 2 2x 2 n)n x 2或写成 s21 n(x 2 1x 2 2x 2 n) x 2,即方差等于原数据平方的平均数减去 平均数的平方. 2. 茎叶图的应用 (1)茎叶图中的“茎”上的数字代表十位上的数字,“叶”上的数字代表个位上的数字(若没有则表示该

9、 数据不存在); (2)解题时,可把茎叶图中的数字按大小顺序转化为总体的个体数字再求解. 3. 绘制频率分布直方图时的 2 个注意点 (1)制作好频率分布表后,可以利用各组的频率之和是否为 1 来检验该表是否正确 (2)频率分布直方图的纵坐标是频率 组距,而不是频率 4由频率分布直方图进行相关计算时,需掌握的 2 个关系式 (1)频率 组距组距频率 (2) 频数 样本容量频率,此关系式的变形为 频数 频率样本容量,样本容量频率频数. 参考答案 频率分布 数字特征 频率 组距 面积 等于 1 样本容量 组数 总体密度曲线 百分比 最多 最中间 中位数 1 n(x1x2xn) 相等 平均数 接近

10、第第三三节节 变量间的相关关系与统计案例变量间的相关关系与统计案例 一、必记 4 个知识点 1两个变量的线性相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相 关 (2)负相关 在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关 (3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在_附近,就称这两个变量之间具有线性相关关系, 这条直线叫做回归直线 2回归方程 (1)最小二乘法 求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法 (2)回归方程 方程y bxa是两个具有线性相关关

11、系的变量的一组数据(x 1,y1),(x2,y2),(xn,yn)的回归方程, 其中a ,b是待定参数 b n i1 xi x yi y n i1 xi x 2 n i1xiyin x y n i1x 2 in x 2 , a y b x . 3回归分析 (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法 (2)样本点的中心 对于一组具有线性相关关系的数据(x1, y1), (x2, y2), , (xn, yn)中_称为样本点的中心 (3)相关系数 当 r0 时,表明两个变量_; 当 r0 时,表明两个变量_. r 的绝对值越接近于 1,表明两个变量的线性相关性_. r 的绝对值

12、越接近于 0,表明两个变量之间几乎不存在线性相关关系通常|r|大于_时,认为 两个变量有很强的线性相关性 4独立性检验 (1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量 (2)列联表:列出两个分类变量的频数表,称为列联表假设有两个分类变量 X 和 Y,它们的可能取值 分别为x1,x2和y1,y2,其样本频数列联表(称为 22 列联表)为: y1 y2 总计 x1 a b ab x2 c d cd 总计 ac bd abcd 构造一个随机变量 K2 nadbc2 abcdacbd,其中 nabcd 为样本容量 (3)独立性检验 利用随机变量 K2来判断“两个分类变量

13、有关系”的方法称为独立性检验 二、必明 4 个易误点 1回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的 回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义 2根据回归方程进行预报,仅是一个预报值,而不是真实发生的值 3r 的大小只说明是否相关,并不能说明拟合效果的好坏,R2才是判断拟合效果好坏的依据,必须将 二者区分开来 4独立性检验的随机变量 K22.706 是判断是否有关系的临界值,K22.706 应判断为没有充分依据显 示 X 与 Y 有关系,而不能作为小于 90%的量化值来作出判断 三、技法 1. 判定两个变量正、负相关性的方法 (1)画

14、散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量 负相关 (2)相关系数:r0 时,正相关;r0 时,负相关 (3)线性回归方程中:b 0 时,正相关;b0 时,负相关. 2. 求线性回归方程的基本步骤 (1)先把数据制成表,从表中计算出 x 、 y,x2 1x 2 2x 2 n、x1y1x2y2xnyn的值 (2)计算回归系数a ,b. (3)写出线性回归方程y bxa. 注:回归方程一定过点( x , y). 3. 解独立性检验的应用问题的关注点 (1)两个明确: 明确两类主体; 明确研究的两个问题 (2)两个关键: 准确画出 22 列联表; 准确理解 K2. 提醒:准确计算 K2的值是正确判断的前提. 参考答案 一条直线 ( x , y ) 正相关 负相关 越强 0.75

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 高中 > 高中数学 > 数学高考 > 备考策略