1、统计统计 (知识点总结(知识点总结+ +例题讲解)例题讲解) 一、调查收集数据的过程与方法以及统计学基本概念:一、调查收集数据的过程与方法以及统计学基本概念: 1.调查方式: (1)普查:为了某一特定目的,而对考察对象进行全面的调查,叫普查; (2)抽样调查:抽取一部分对象进行调查,然后根据调查数据推断全体对象的情况。 2.统计学中的几个基本概念: (1)总体:所有考察对象的全体叫做总体; (2)个体:总体中每一个考察对象叫做个体; (3)样本:从总体中所抽取的一部分个体叫做总体的一个样本; (4)样本容量:样本中个体的数目叫做样本容量; (5)样本平均数:样本中所有个体的平均数叫做样本平均数
2、; (6)总体平均数:总体中所有个体的平均数叫做总体平均数,在统计中,通常用样本平均数 估计总体平均数。 【例题【例题 1 1】(2020安顺)2020 年为阻击新冠疫情,某社区要了解每一栋楼的居民年龄情况, 以便有针对性进行防疫,一志愿者得到某栋楼 60 岁以上人的年龄(单位:岁)数据如下:62, 63,75,79,68,85,82,69,70获得这组数据的方法是( ) A直接观察 B实验 C调查 D测量 【答案】C 【解析】直接利用调查数据的方法分析得出答案 解:一志愿者得到某栋楼 60 岁以上人的年龄(单位:岁)数据如下:62,63,75,79,68, 85,82,69,70获得这组数据
3、的方法是:调查故选:C 【变式练习【变式练习 1 1】某校为了解七年级 14 个班级学生吃零食的情况,下列做法中,比较合理的是 ( ) A了解每一名学生吃零食情况 B了解每一名女生吃零食情况 C了解每一名男生吃零食情况 D每班各抽取 7 男 7 女,了解他们吃零食情况 【答案】D 【解析】根据样本抽样的原则要求,逐项进行判断即可 解:根据样本抽样具有普遍性、代表性和可操作性,选项 D 比较合理, 选项 A 为普查,没有必要,也不容易操作; 选项 B、C 仅代表男生或女生的情况,不能反映全面的情况,不具有代表性,故选:D 【例题【例题 2 2】为了调查某校学生的视力情况,在全校的 1000 名学
4、生中随机抽取了 80 名学生,下 列说法正确的是( ) A此次调查属于全面调查 B1000 名学生是总体 C样本容量是 80 D被抽取的每一名学生称为个体 【答案】C 【解析】总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽 取的一部分个体,而样本容量则是指样本中个体的数目我们在区分总体、个体、样本、样本 容量,这四个概念时,首先找出考查的对象从而找出总体、个体再根据被收集数据的这一 部分对象找出样本,最后再根据样本确定出样本容量 解:A、此次调查属于抽样调查,故本选项不合题意; B、1000 名学生的视力情况是总体,故本选项不合题意;C、样本容量是 80,正确; D
5、、被抽取的每一名学生的视力情况称为个体故本选项不合题意故选:C 【变式练习【变式练习 2 2】为了解 500 人身高情况,从中抽取 50 人进行身高统计分析样本是() A500 人 B所抽 50 人 C500 人身高 D所抽 50 人身高 【答案】D 【解析】根据样本的意义得出判断即可 解:在这个问题中,“抽取 50 人的身高情况”是整体的一个样本,故选:D 二、频数、频率与统计图表:二、频数、频率与统计图表: 1.1.频数分布直方图:频数分布直方图: (1)把每个对象出现的次数叫做频数; (2)每个对象出现的次数与总次数的比(或者百分比)叫频率; 频数和频率都能够反映每个对象出现的频繁程度;
6、 频率 频数 样本容量 ; (3)频数分布表、频数分布直方图都能直观、清楚地反映数据在各个小范围内的分布情况; (4)频数分布直方图的绘制步骤是: 计算最大值与最小值的差(即:极差); 决定组距与组数,一般将组数分为 512 组; 确定分点,常使分点比数据多一位小数,且把第一组的起点稍微减小一点; 列频数分布表; 用横轴表示各分段数据,纵轴反映各分段数据的频数,小长方形的高表示频数,绘制频 数分布直方图 2.2.频率分布的意义:频率分布的意义:在许多问题中,只知道平均数和方差还不够,还需要知道样本中数据在各 个小范围所占的比例的大小,这就需要研究如何对一组数据进行整理,以便得到它的频率分 布。
7、 3.3.研究频率分布的一般步骤及有关概念:研究频率分布的一般步骤及有关概念: (1)研究样本的频率分布的一般步骤是: 计算极差(最大值与最小值的差); 决定组距与组数; 决定分点; 列频率分布表; 画频率分布直方图。 (2)频率分布的有关概念: 极差:最大值与最小值的差; 频数:落在各个小组内的数据的个数; 频率:每一小组的频数与数据总数(样本容量 n)的比值叫做这一小组的频率。 4.4.统计图:统计图:是表示统计数据的图形,是数据及其之间关系的直观表现;常见的统计图有: (1)条形统计图:条形统计图就是用长方形的高来表示数据的图形; 条形图能够显示每组中的具体 数据 ; (2)折线统计图:
8、用几条线段连成的折线来表示数据的图形; 折线图能够显示数据的 变化 趋势; (3)扇形统计图:用一个圆代表总体,圆中的各个扇形分别代表总体中的不同部分,扇形的 大小反映部分在总体中所占百分比大小,这样的统计图叫扇形统计图; 扇形图能够显示部分在 总体 中的百分比; (4)频数分布直方图、频数折线图:能显示各组频数分布的情况,显示各组之间频数的差别。 【例题【例题 3 3】一组数据共 100 个,分为 6 组,第 14 组的频数分别为 10,14,16,20,第 5 组 的频率为 0.20,则第 6 组的频数为( ) A20 B22 C24 D30 【答案】A 【解析】直接利用频数与频率的关系得
9、出第 5 组的频数,进而得出答案 解:一组数据共 100 个,第 5 组的频率为 0.20,第 5 组的频数是:1000.2020, 一组数据共 100 个,分为 6 组,第 14 组的频数分别为 10,14,16,20, 第 6 组的频数为:100201014162020故选:A 【变式练习【变式练习 3 3】“早发现,早报告,早隔离,早治疗”是我国抗击“新冠肺炎”的宝贵经验, 其中“早”字出现的频率是( ) A 1 12 B1 4 C2 3 D1 3 【答案】D 【解析】利用频率的计算方法计算即可解:“早”字出现的频率是: 4 12 = 1 3,故选:D 【例题【例题 4 4】某校九年级随
10、机抽查一部分学生进行了 1 分钟仰卧起坐次数的测试,并将其绘制成 如图所示的频数直方图那么仰卧起坐次数在 2530 次的人数占抽查总人数的百分比是 ( ) A40% B30% C20% D10% 【答案】A 【解析】用仰卧起坐次数在 2530 次的人数除以被调查的总人数即可 解:仰卧起坐次数在 2530 次的人数占抽查总人数的百分比是 12 3:10:12:5 100%40%, 故选:A 【变式练习【变式练习 4 4】某次考试中,某班级的数学成绩被绘制成了如图所示的频数分布直方图下列 说法错误的是( ) A得分在 7080 分之间的人数最多 B及格(不低于 60 分)的人数为 26 C得分在
11、90100 分之间的人数占总人数的 5% D该班的总人数为 40 【答案】B 【解析】根据频数分布直方图得出各分数段内的人数,再据此对各选项逐一判断即可 解:A得分在 7080 分之间的人数最多,有 14 人,此选项正确,不符合题意; B及格(不低于 60 分)的人数为 12+14+8+236(人),此选项错误,符合题意; C总人数为 4+12+14+8+240(人), 得分在 90100 分之间的人数占总人数的百分比为 2 40 100%5%, 此选项正确, 不符合题意; D该班的总人数为 40,此选项正确,不符合题意; 故选:B 【例题【例题 5 5】某校八(1)班全体同学喜欢的球类运动如
12、图所示则从图中可以直接看出( ) A喜欢各种球类的具体人数 B全班同学一学期来喜欢各种球类的变化情况 C全班的总人数 D全班同学现在喜欢各种球类人数的百分比 【答案】D 【解析】利用扇形统计图的特点,可以得到各类所占的比例,但总数不确定,不能确定每类的 具体人数 解: 因为扇形统计图直接反映部分占总体的百分比大小, 不能反映具体数量的多少和变化情况, 所以 A、B、C 都错误,故选:D 【变式练习【变式练习 5 5】在计算机上,为了让使用者清楚、直观地看出硬盘的“已用空间”占“整个磁 盘空间“的百分比,使用的统计图是( ) A条形统计图 B折线统计图 C扇形统计图 D三种统计图都可以 【答案】
13、C 【解析】 要表示各部分占总体的百分比, 根据扇形统计图表示的是部分在总体中所占的百分比, 即可进行选择 解:要反映出磁盘“已用空间”占“整个磁盘空间”的百分比,需选用扇形统计图 故选:C 【例题【例题 6 6】小明家 1 至 6 月份的用水量统计如图所示,根据图中的数据可知,5 月份的用水量 比 3 月份的用水量多 吨 【答案】3 【解析】根据折线统计图给出的数据进行相减即可 解:由折线统计图知,5 月份用的水量是 6 吨,3 月份用的水量是 3 吨, 则 5 月份的用水量比 3 月份的用水量多 3 吨;故答案为:3 【变式练习【变式练习 6 6】如图是某校七年级学生到校方式的统计图,由图
14、可得出乘公共交通的人数占七 年级学生总人数的( ) A30% B40% C50% D60% 【答案】B 【解析】由统计图可以得到七年级学生总数为 80+100+120300 人,采取乘公共交通的有 120 人,可计算出乘公共交通的所占的百分比 解:120(80+100+120)100%40%,故选:B 三、平均数、众数、中位数:三、平均数、众数、中位数: 1.1.平均数的概念:平均数的概念: (1)平均数:一般地,如果有 n 个数 x1,x2,xn,那么, 12 1 () n xxxx n 叫做这 n 个 数的平均数,x 读作“x 拔”; (2)加权平均数:如果 n 个数中,x1出现 f1次,
15、x2出现 f2次,xk出现 fk次 (这里 f1+ f2+fk=n),那么,根据平均数的定义, 这 n 个数的平均数可以表示为 1 122kk x fx fx f x n , 这样求得的平均数x叫做加权平均数,其中 f1,f2,fk叫做权。 2.2.平均数的计算方法:平均数的计算方法: (1)定义法:当所给数据 x1,x2,xn比较分散时;一般选用定义公式: 12 1 () n xxxx n ; (2)加权平均数法:当所给数据重复出现时;一般选用加权平均数公式: 1 122kk x fx fx f x n ,其中 f1+ f2+fk=n; (3)新数据法:当所给数据都在某一常数 a 的上下波动
16、时,一般选用简化公式: xxa; 其中,常数 a 通常取接近这组数据平均数的较“整”的数; x1=x1-a,x2=x2-a ,; xn=xn-a 12 1 () n xxxx n 是新数据的平均数; (通常把 x1,x2,xn叫做原数据,x1,x2,xn叫做新数据)。 3.3.众数:众数:在一组数据中,出现次数最多的数据叫做这组数据的众数; 4.4.中位数:中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的 平均数)叫做这组数据的中位数; 5.5.中位数、众数、平均数都是描述一组数据的中位数、众数、平均数都是描述一组数据的 集中程度集中程度 的特征数的特征数。 【
17、例题【例题 7 7】(2020铜仁市)一组数据 4,10,12,14,则这组数据的平均数是( ) A9 B10 C11 D12 【答案】B 【解析】对于 n 个数 x1,x2,xn,则x = 1 n(x1+x2+xn)就叫做这 n 个数的算术平均数, 据此列式计算可得 解:这组数据的平均数为1 4 (4+10+12+14)10,故选:B 【变式练习【变式练习 7 7】(2020杭州)在某次演讲比赛中,五位评委给选手圆圆打分,得到互不相等 的五个分数若去掉一个最高分,平均分为 x;去掉一个最低分,平均分为 y;同时去掉一个 最高分和一个最低分,平均分为 z,则( ) Ayzx Bxzy Cyxz
18、 Dzyx 【答案】A 【解析】根据题意,可以判断 x、y、z 的大小关系,从而可以解答本题 解:由题意可得, 若去掉一个最高分,平均分为 x,则此时的 x 一定小于同时去掉一个最高分和一个最低分后的 平均分为 z, 去掉一个最低分,平均分为 y,则此时的 y 一定大于同时去掉一个最高分和一个最低分后的平 均分为 z,故 yzx,故选:A 【例题【例题 8 8】(2020眉山)某校评选先进班集体,从“学习”、“卫生”、“纪律”、“活动 参与”四个方面考核打分,各项满分均为 100,所占比例如下表: 项目 学习 卫生 纪律 活动参与 所占比例 40% 25% 25% 10% 八年级 2 班这四项
19、得分依次为 80,90,84,70,则该班四项综合得分(满分 100)为( ) A81.5 B82.5 C84 D86 【答案】B 【解析】 根据题意和加权平均数的计算方法, 可以计算出八年级 2 班四项综合得分 (满分 100) , 本题得以解决 解:8040%+9025%+8425%+7010%82.5(分), 即八年级 2 班四项综合得分(满分 100)为 82.5 分,故选:B 【变式练习【变式练习 8 8】(2020德阳)某商场销售 A,B,C,D 四种商品,它们的单价依次是 50 元, 30 元,20 元,10 元某天这四种商品销售数量的百分比如图所示,则这天销售的四种商品的 平均
20、单价是( ) A19.5 元 B21.5 元 C22.5 元 D27.5 元 【答案】C 【解析】根据加权平均数定义即可求出这天销售的四种商品的平均单价 解:这天销售的四种商品的平均单价是: 5010%+3015%+2055%+1020%22.5(元),故选:C 【例题【例题 9 9】(2020益阳)一组数据由 4 个数组成,其中 3 个数分别为 2,3,4,且这组数据的 平均数为 4,则这组数据的中位数为( ) A7 B4 C3.5 D3 【答案】C 【解析】先根据算术平均数的概念求出另外一个数据,从而得出这组数据,再利用中位数的概 念求解可得 解:根据题意知,另外一个数为 44(2+3+4
21、)7, 所以这组数据为 2,3,4,7,则这组数据的中位数为3:4 2 =3.5,故选:C 【变式练习【变式练习 9 9】(2020荆门)为了了解学生线上学习情况,老师抽查某组 10 名学生的单元测 试成绩如下:78,86,60,108,112,116,90,120,54,116这组数据的平均数和中位数 分别为( ) A95,99 B94,99 C94,90 D95,108 【答案】B 【解析】根据平均数和中位数的定义即可得到结论 解:这组数据的平均数= 1 10(78+86+60+108+112+116+90+120+54+116)94, 把这组数据按照从小到大的顺序排列为:54,60,78
22、,86,90,108,112,116,116,120, 这组数据的中位数= 90:108 2 =99,故选:B 【例题【例题 1010】(2020葫芦岛)一组数据 1,4,3,1,7,5 的众数是( ) A1 B2 C2.5 D3.5 【答案】A 【解析】众数是指一组数据中出现次数最多的数据;据此即可求得正确答案 解:本题中数据 1 出现了 2 次,出现的次数最多,所以本组数据的众数是 1故选:A 【变式练习【变式练习 1010】(2020包头)两组数据:3,a,b,5 与 a,4,2b 的平均数都是 3若将这 两组数据合并为一组新数据,则这组新数据的众数为( ) A2 B3 C4 D5 【答
23、案】B 【解析】根据平均数的意义,求出 a、b 的值,进而确定两组数据,再合并成一组,找出出现 次数最多的数据即可 解:由题意得,3 + a + b + 5 = 3 4 a + 4 + 2b = 3 3 ,解得a = 3 b = 1, 这两组数据为:3、3、1、5 和 3、4、2,这两组数合并成一组新数据, 在这组新数据中,出现次数最多的是 3,因此众数是 3,故选:B 四、极差、方差、标准差:四、极差、方差、标准差: 1.1.极差:极差:一组数据中 最大值与最小值 的差。 2.2.方差的概念:方差的概念:在一组数据 x1,x2,xn中,各数据与它们的平均数x的差的平方的平均数, 叫做这组数据
24、的方差通常用“s2”表示; 即 2222 12 1( )()() n sxxxxxx n ; 3.3.方差的计算:方差的计算: (1)基本公式: 2222 12 1( )()() n sxxxxxx n ; (2)简化计算公式(): 2 2222 12 1( ) n sxxxnx n ; 也可写成: 2 2222 12 1( ) n sxxxx n ; 此公式的记忆方法是:方差等于原数据平方的平均数减去平均数的平方; (3)简化计算公式(): 2 2222 12 1( ) n sxxxnx n ; 当一组数据中的数据较大时,可以依照简化平均数的计算方法,将每个数据同时减去一个 与它们的平均数接
25、近的常数 a, 得到一组新数据 x1=x1-a,x2=x2-a ,xn=xn-a ; 那么, 2 2222 12 1( ) n sxxxx n ; 此公式的记忆方法是:方差等于新数据平方的平均数减去新数据平均数的平方; (4)新数据法:原数据 x1,x2,xn的方差与新数据 x1=x1-a,x2=x2-a ,xn=xn-a 的方差相等; 也就是说,根据方差的基本公式, 求得 x1,x2,xn的方差就等于原数据的方差; 4.4.标准差:标准差:方差的算数平方根叫做这组数据的标准差,用“s”表示,即 2222 12 1( )()() n ssxxxxxx n ; 5.5.方差是衡量一组数据方差是衡
26、量一组数据 波动大小波动大小 的量,的量, 方差越大, 数据的方差越大, 数据的 波动波动 越大, 方差越小, 数据的越大, 方差越小, 数据的 波波 动动 越小。越小。 【例题【例题 1111】(2020巴中)某地区一周内每天的平均气温如下:25,27.3,21,21.4, 28,33.6,30这组数据的极差为( ) A8.6 B9 C12.2 D12.6 【答案】D 【解析】根据极差的公式:极差最大值最小值找出所求数据中最大的值 33.6,最小值 21.4,再代入公式求值 解:由题意可知,数据中最大的值 33.6,最小值 21, 所以极差为 33.62112.6故选:D 【变式练习【变式练
27、习 1111】(2019湘潭)随着长株潭一体化进程不断推进,湘潭在交通方面越来越让人 期待将要实施的“两干一轨”项目中的“一轨”,是将长沙市地铁 3 号线南延至湘潭北站, 往返长潭两地又将多“地铁”这一选择为了解人们选择交通工具的意愿,随机抽取了部分市 民进行调查,并根据调查结果绘制如下统计图,关于交通工具选择的人数数据,以下结论正确 的是( ) A平均数是 8 B众数是 11 C中位数是 2 D极差是 10 【答案】A 【解析】从条形统计图中可以知道,选择公交 7 人,火车 2 人,地铁 13 人,轻轨 11 人,其它 7 人, 极差为 13211,故 D 不正确;出现次数最多的是 7,即众
28、数是 7,故 B 不正确,从小到大 排列,第 3 个数都是 7,即中位数是 7,故 C 是不正确的; (7+2+13+11+7)58,即平均数是 8,故 A 是正确的 解:(7+2+13+11+7)58,即平均数是 8,故 A 是正确的 出现次数最多的是 7,即众数是 7,故 B 不正确, 从小到大排列,第 3 个数都是 7,即中位数是 7,故 C 是不正确的; 极差为 13211,故 D 不正确;故选:A 【例题【例题 1212】数据 201,202,198,199,200 的方差与极差分别是( ) A1,4 B2,2 C2,4 D4,2 【答案】C 【解析】用最大值减去最小值可得极差,先求
29、出这组数据的平均数,再根据方差的计算公式列 式计算即可 解:极差为 2021984;平均数为201:202:198:199:200 5 =200, 方差为1 5 (201200) 2+(202200)2+(198200)2+(199200)2+(200200)22, 故选:C 【变式练习【变式练习 1212】若一组数据 x1+1,x2+1,xn+1 的平均数为 10,方差为 1,则另一组数据 3x1+2,3x2+2,3xn+2 的方差是 【答案】9 【解析】根据平均数和方差的变化规律,即可得出答案 解:数据 x1+1,x2+1,xn+1 的平均数为 10, 数据 3x1+2,3x2+2,3xn
30、+2 的平均数为 310129, 数据 x1+1,x2+1,xn+1 的方差为 1, 数据 3x1+2,3x2+2,3xn+2 的方差是 13 29; 故答案为:9 【例题【例题 1313】已知一组数据的方差是 3,则这组数据的标准差是( ) A9 B3 C3 2 D3 【答案】D 【解析】根据标准差是方差的算术平方根,即可得出答案 解:数据的方差是 S 23,这组数据的标准差是3;故选:D 【变式练习【变式练习 1313】已知数据 x1,x2,xn的平均数是 2,方差是 0.1,则 4x12,4x22, 4xn2 的平均数和标准差分别为( ) A2,1.6 B2,210 5 C6,0.4 D6,210 5 【答案】D 【解析】根据方差的特点,若在原来数据前乘以同一个数,平均数也乘以同一个数,数据都加 上一个数(或减去一个数)时,方差不变;数据都乘以同一个数时,方差乘以这个数的平方, 即可得出答案 解:数据 x1,x2,xn的平均数是 2, 4x12,4x22,4xn2 的平均数是 2426; 数据 x1,x2,xn的方差是 0.1, 4x12,4x22,4xn2 的方差是 4 20.11.6, 4x12,4x22,4xn2 的标准差是1.6 = 210 5 ; 故选:D