1、数据的收集统计与概率数据的收集统计与概率 1统计方法 全面调查:对所有的考察对象作调查叫全面调查 抽样调查:从所有对象中抽取一部分作调查分析叫抽样调查 说明:当受客观条件限制,无法对所有个体进行调查时,或当调查具有破坏性,不允许全面调查时,宜采用抽样调 查 2与统计有关的概念 总体:所要考察的对象的_叫总体 样本:从总体中抽取的_是总体的一个样本 个体:组成总体的_考察对象 样本容量:样本中个体的数目 频数:数据分组后落在各小组内数据的个数为频数,频数之和等于总数 频率:每一组数据频数与数据总数的比叫做这一组数据(或事件)的频率频率之和等于_ 3统计图表 扇形统计图是用圆代表总体,圆中各个扇形
2、分别代表总体中的不同部分的统计图,它可以直观地反映_ 的百分比大小,一般不表示具体的数量 条形统计图能清楚地表示每个项目的_及反映事物某一阶段属性的_,复合条形图的描述对象 是多组数据 折线统计图可以反映数据的_ 频数分布表和频数分布直方图:能直观、清楚地反映数据在各个小范围内的分布情况 【知识拓展】 绘制频数分布直方图的一般步骤: (1)计算最大值与最小值的差; (2)决定组距与组数(一般取 812 组); (3)确定分点,常使分点比数据多一位小数,并且把第一组的起点稍微减小一点; (4)列频数分布表; (5)用横轴表示各分段数据,纵轴反映各分段数据的频数,小长方形的高表示频数,绘制频数分布
3、直方图 数形结合思想 数形结合是重要的数学思想,利用它可以直观地解决问题利用统计图表解决数学问题时,一定要仔细观察,发掘 图表中所提供的信息,把图表中的信息与相应的数学知识、数学方法、数学模型联系起来,正确解决提出的问题, 此类问题是中考的热点 类型一 统计的方法 典例 2019 济宁以下调查中,适宜全面调查的是( ) A调查某批次汽车的抗撞击能力 B调查某班学生的身高情况 C调查春节联欢晚会的收视率 D调查济宁市居民日平均用水量 思维升华 (1)下列的情形常采用抽样调查:当受客观条件的限制,无法对所有个体进行调查时,如调查某市中学 生的视力;当调查具有破坏性,不允许普查时,如调查某批灯泡的使
4、用寿命;当总体的容量较大,个体分布较 广时调查多受客观条件限制,宜用抽样调查(2)抽样调查的要求:抽查的样本要有代表性;抽查样本的个体的 数目不能太少 类型二 频数与频率 典例 2019 扬州扬州市“五个一百工程”在各校普遍开展,为了了解某校学生每天课外阅读所用的时间情况,从 该校学生中随机抽取了部分学生进行问卷调查,并将结果绘制成如下不完整的频数分布表和频数分布直方图。 根据以上信息,回答下列问题: (1) 表 中a _ , b _; (2)请补全频数分布直方图; (3)若该校有学生 1 200 人,试估计该校学生每天课外阅读时间超过 1 h 的人数 跟踪训练 1.2018 杭州某校积极参与
5、垃圾分类活动, 以班级为单位收集可回收的垃圾, 如图 345 是七年级各班一 周收集的可回收垃圾的质量的频数表和频数直方图(每组含前一个边界值,不含后一个边界值) 某校七年级各班一周收集的 可回收垃圾的质量的频数表 每天课外阅读时间 t/h 频数 频率 0t0.5 24 0.5t1 36 0.3 1t1.5 0.4 1.5t2 12 b 合计 a 1 组别(kg) 频数 (1)求 a 的值; (2)已知收集的可回收垃圾以 0.8 元/kg 被回收,该年级这周收集的可回收垃圾被回收后所得金额能否达到 50 元? 22018 宁波在第 23 个世界读书日前夕,我市某中学为了解本校学生的每周课外阅读
6、时间(用 t 表示,单位:h), 采用随机抽样的方法进行问卷调查,调查结果按 0t2,2t3,3t4,t4 分为四个等级,并依次用 A,B, C,D 表示,根据调查结果统计的数据,绘制成了如图 346 所示的两幅不完整的统计图,由图中给出的信息解答 下列问题: (1)求本次调查的学生人数; (2)求扇形统计图中等级 B 所在扇形的圆心角度数,并把条形统计图补充完整; (3)若该校共有学生 1 200 人,试估计每周课外阅读时间满足 3t4 的人数 类型三 统计图表在实际生活中的应用 典例 2019 绍兴小明、小聪参加了 100 m 跑的 5 期集训,每期集训结束时进行测试,根据他们的集训时间、
7、测试 成绩绘制成如图 347 的两个统计图 4.04.5 2 4.55.0 a 5.05.5 3 5.56.0 1 根据图中信息,解答下列问题: (1)这 5 期的集训共有多少天?小聪 5 次测试的平均成绩是多少? (2)根据统计数据,结合体育运动的实际,从集训时间和测试成绩这两方面,说说你的想法 跟踪训练 1.2019 衢州某校为积极响应“南孔圣地, 衢州有礼”城市品牌建设, 在每周五下午第三节课开展了丰富 多彩的走班选课活动其中综合实践类共开设了“礼行”“礼知”“礼思”“礼艺”“礼源”等五门课程,要求全 校学生必须参与其中一门课程为了解学生参与综合实践类课程活动情况,随机抽取了部分学生进行
8、调查,根据调 查结果绘制了如图 348 所示不完整的条形统计图和扇形统计图 (1)请问被随机抽取的学生共有多少名?并补全条形统计图; (2)在扇形统计图中,求选择“礼行”课程的学生人数所对应的扇形圆心角的度数; (3)若该校共有学生 1 200 人,估计其中参与“礼源”课程的学生共有多少人? 22019 台州安全使用电瓶车可以大幅度减少因交通事故引发的人身伤害,为此交警部门在全市范围开展了安全 使用电瓶车专项宣传活动在活动前和活动后分别随机抽取了部分使用电瓶车的市民,就骑电瓶车戴安全帽情况进 行问卷调查,将收集的数据制成如下统计图表(图 349) (1)宣传活动前,在抽取的市民中哪一类别的人数
9、最多?占抽取人数的百分之几? (2)该市约有 30 万人使用电瓶车,请估计活动前全市骑电瓶车“都不戴”安全帽的总人数; (3)小明认为,宣传活动后骑电瓶车“都不戴”安全帽的人数为 178,比活动前增加了 1 人,因此交警部门开展的宣 传活动没有效果小明分析数据的方法是否合理?请结合统计图表,对小明分析数据的方法及交警部门宣传活动的 效果谈谈你的看法 1抽样调查时注意要具有广泛性、代表性,样本容量是不带单位的数目 2频数直方图、频率分布直方图、频率分布条形图的区别:频数直方图是用小长方形的高度表示频数,在频率分 布直方图中小长方形的高表示频数 组距,而频率分布条形图是用小长方形的高度表示各个部分
10、的频率 统计概念理解误区 今年某市有 1.6 万名初中毕业生参加升学考试, 为了了解这 1.6 万名考生的数学成绩, 从中抽取 2 000 名考生的数学 成绩进行统计,在这个问题中样本是( ) A1.6 万名考生 B2 000 名考生 C1.6 万名考生的数学成绩 D2 000 名考生的数学成绩 第第 15 课时课时 数据的整理与分析数据的整理与分析 1数据的代表 平均数:一组数据的平均值称为这组数据的平均数 算术平均数:一般地,如果有 n 个数 x1,x2,xn,那么,_叫做这 n 个数的算术平均数 加权平均数: 在求 n 个数的平均数时, 如果 x1出现 f1次, x2出现 f2次, ,
11、xk出现 fk次, (其中 f1f2fk_), 那么, x 1 n( _)叫做 x1, x2, , xk这 k 个数的加权平均数, 其中 f1, f2, , fk分别叫做 x1, x2, , xk的_ 中位数:将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则称处于_为这 组数据的中位数,如果数据的个数是偶数,则中间_就是这组数据的中位数 众数:一组数据中出现次数_的数据叫做这组数据的众数 2数据的波动 方差:各个数据与_的差的平方的平均数叫做这组数据的方差,记为 S2,一般地,设 n 个数据 x1,x2, xn的平均数为x , 则 S2_, 它反映了一组数据的波动性大小
12、, 方差越大, 波动性越_, 反之也成立 标准差:方差的_叫做标准差,记做 S.S S2. 1统计量的作用 平均数常用来反映数据的整体趋势,众数常用来反映数据的集中趋势,中位数常用来反映数据的中间值方差常用 来反映数据的波动,方差大、波动大,方差小、波动小 2用样本估计总体 统计基本思想:利用样本的特征去估计总体的特征是推断统计的基本思想 统计决策依据:利用数据进行决策时,要全面、多角度地去分析已有数据,比较它们的代表值和波动,发现它们的 变化规律和发展趋势,从而做出正确决策这是中考的热点考题 类型一 平均数、众数及中位数 典例 2018 宁波若一组数据 4,1,7,x,5 的平均数为 4,则
13、这组数据的中位数为( ) A7 B5 C4 D3 跟踪训练 1.2018 台州某篮球运动员在连续 7 场比赛中的得分(单位:分)依次为 20,18,23,17,20,20,18,则 这组数据的众数与中位数分别是( ) A18 分,17 分 B20 分,17 分 C20 分,19 分 D20 分,20 分 2 2018 金华如图是我国 20132017 年国内生产总值增长速度统计图, 则这 5 年增长速度的众数是_ 3数据 1,3,5,12,a 中整数 a 是这组数据中的中位数,则该组数据的平均数是_ 类型二 方差与标准差 典例 2019 杭州称量五筐水果的质量,若每筐以 50 千克为基准,超过
14、基准部分的千克数记为正数,不足基准部分 的千克数记为负数,甲组为实际称量读数,乙组为记录数据,并把所得数据整理成如下统计表(单位:千克)和未完 成的统计图(图 353) 实际称量读数和记录数据统计表 序号数据 1 2 3 4 5 甲组 48 52 47 49 54 乙组 2 2 3 1 4 (1)补充完成乙组数据的折线统计图; (2)甲,乙两组数据的平均数分别为x 甲,x 乙,写出x 甲与x 乙之间的等量关系 甲,乙两组数据的方差分别为 S2甲,S2乙,比较 S2甲与 S2乙的大小,并说明理由 跟踪训练 1.2019 宁波去年某果园随机从甲、乙、丙、丁四个品种的葡萄树中各采摘了 10 棵,每棵
15、产量的平均数x (单位:千克)及方差 S2(单位:千克 2)如表所示: 甲 乙 丙 丁 x 24 24 23 20 S2 2.1 1.9 2 1.9 今年准备从四个品种中选出一种产量既高又稳定的葡萄树进行种植,应选的品种是( ) A甲 B乙 C丙 D丁 2 2019 安顺已知一组数据 x1, x2, x3, , xn的方差为 2, 则另一组数据 3x1, 3x2, 3x3, , 3xn的方差为_ 32019 滨州若一组数据 4,x,5,y,7,9 的平均数为 6,众数为 5,则这组数据的方差为_ 类型三 统计决策 典例 2019 舟山、 嘉兴在“创全国文明城市”活动中, 某社区为了了解居民掌握
16、垃圾分类知识的情况进行调查 其 中 A,B 两小区分别有 500 名居民,社区从中各随机抽取 50 名居民进行相关知识测试,并将成绩进行整理得到部分 信息: 【信息一】A 小区 50 名居民成绩的频数直方图如图 354(每一组含前一个边界值,不含后一个边界值); 【信息二】图中,从左往右第四组的成绩如下: 75 75 79 79 79 79 80 80 81 82 82 83 83 84 84 84 【信息三】A,B 两小区各 50 名居民成绩的平均数、中位数、众数、优秀率(80 分及以上为优秀)、方差等数据如下 (部分空缺): 小区 平均数 中位数 众数 优秀率 方差 A 75.1 79 4
17、0% 277 B 75.1 77 76 45% 211 根据以上信息,回答下列问题: (1)求 A 小区 50 名居民成绩的中位数; (2)请估计 A 小区 500 名居民中能超过平均数的有多少人? (3)请尽量从多个角度比较、分析 A,B 两小区居民掌握垃圾分类知识的情况 思维升华 (1)利用样本估计总体时,常用样本的平均数、方差、频率作为总体的平均数、方差、频率的估计值; (2)中位数是一个位置代表值,利用中位数分析数据可以获得一些信息如果已知一组互不相同的数据的中位数,那 么可以知道小于或大于这个中位数的数据大约各占一半众数是一组数据中出现次数最多的数据,当一组数据有较 多重复数据时,众
18、数往往是人们所关心的数一组数据的极差、方差越小,这组数据越稳定 跟踪训练 1.2019 温州车间有 20 名工人,某一天他们生产的零件个数统计如下表 车间 20 名工人某一天生产的零件个数统计表 (1)求这一天 20 名工 人生产零件的平均 个数; (2)为了提高大多数工人的积极性,管理者准备实行“每天定额生产,超产有奖”的措施如果你是管理者,从 平均数、中位数、众数的角度进行分析,你将如何确定这个“定额”? 22018 嘉兴某厂为了检验甲、乙两车间生产的同一款新产品的合格情况(尺寸范围为 176 mm185 mm 的产品为 合格),随机各抽取了 20 个样品进行检测,过程如下: 生产零件的个
19、数(个) 9 10 11 12 13 15 16 19 20 工人人数(人) 1 1 6 4 2 2 2 1 1 收集数据(单位:mm): 甲车间:168,175,180,185,172,189,185,182,185,174,192,180,185,178,173,185,169,187,176, 180. 乙车间:186,180,189,183,176,173,178,167,180,175,178,182,180,179,185,180,184,182,180, 183. 整理数据: 组别 频数 165.5170.5 170.5175.5 175.5180.5 180.5185.5 18
20、5.5190.5 190.5195.5 甲车间 2 4 5 6 2 1 乙车间 1 2 a b 2 0 分析数据: 车间 平均数 众数 中位数 方差 甲车间 180 185 180 43.1 乙车间 180 180 180 22.6 应用数据: (1)计算甲车间样品的合格率; (2)估计乙车间生产的 1 000 个该款新产品中合格产品有多少个? (3)结合上述数据信息,请判断哪个车间生产的新产品更好,并说明理由 1(1)一组数据的中位数和平均数都只有一个,它们一般不等,有时也可能相等; (2)中位数是一个代表值,如果已知一组数据的中位数,那么可以知道,小于或者大于这个中位数的数据各占一半 2(1)如果一组数据中有两个数据的频数一样,都是最大,那么两个数据都是这组数据的众数; (2)当一组数据有较多的重复数据时,众数往往是人们所关心的一个量 3样本的选取要有足够的代表性 忘了数据的个数 衢州中考某中学篮球队 13 名队员的年龄情况如下表: 年龄(岁) 15 16 17 18 人数 3 4 5 1 则这个队队员年龄的中位数是( ) A15.5 B16 C16.5 D17 思维升华 本题考查了中位数,确定中位数的时候一定要先排好顺序,然后再根据奇数和偶数个来确定中位数,如 果数据有奇数个,则正中间的数据即为所求,如果是偶数个则找中间两个数据的平均数,中位数有时不一定是这组 数据里的数