1、专题28 数据统计与分析 专题知识回顾 一、数据的收集、整理与描述1全面调查:考察全体对象的调查方式叫做全面调查。2抽样调查:调查部分数据,根据部分来估计总体的调查方式称为抽样调查。3总体:所有考察对象的全体叫做总体。4个体:总体中每一个考察对象叫做个体。5样本:从总体中所抽取的一部分个体叫做总体的一个样本。6样本容量:样本中个体的数目称为样本容量。7样本平均数:样本中所有个体的平均数叫做样本平均数。8总体平均数:总体中所有个体的平均数叫做总体平均数,在统计中,通常用样本平均数估计总体平均数。9数据描述的方法:条形统计图、扇形统计图、折线统计图、直方图。各类统计图的优劣:条形统计图:能清楚表示
2、出每个项目的具体数目;折线统计图:能清楚反映事物的变化情况;扇形统计图:能清楚地表示出各部分在总体中所占的百分比。10频数:一般地,我们称落在不同小组中的数据个数为该组的频数。11频率:每一小组的频数与数据总数(样本容量n)的比值叫做这一小组的频率。12圆心角的度数=频数与总数的比360或百分比36013.组数和组距:在统计数据时,把数据按照一定的范围分成若干各组,分成组的个数称为组数,每一组两个端点的差叫做组距。14画直方图的步骤:(1)计算最大值与最小值的差;(2)决定组距和组数;(3)决定分点(4)列频数分布表;(5)画频数分布直方图。二、数据的分析1平均数的概念(1)平均数:一般地,如
3、果有n个数那么,叫做这n个数的平均数,读作“x拔”。(2)加权平均数:如果n个数中,出现次,出现次,出现次(这里),那么,根据平均数的定义,这n个数的平均数可以表示为,这样求得的平均数叫做加权平均数,其中叫做权。2平均数的计算方法(1)定义法:当所给数据比较分散时,一般选用定义公式:(2)加权平均数法:当所给数据重复出现时,一般选用加权平均数公式:,其中。3中位数:将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数。 4众数:一组数据中出现次数最多的数据就是这组数据的众数
4、。 5极差:组数据中的最大数据与最小数据的差叫做这组数据的极差。 6方差:一组数据中,每一个数据与它们的平均数的差的平方的平均数,叫做这组数据的方差。通常用“”表示,即 7方差越大,数据的波动越大;方差越小,数据的波动越小,就越稳定。 8当一组数据中的数据较大时,可以依照简化平均数的计算方法,将每个数据同时减去一个与它们的平均数接近的常数a,得到一组新数据,那么,9标准差:方差的算数平方根叫做这组数据的标准差,用“s”表示,即专题典型题考法及解析 【例题1】(2019江西)根据居民家庭亲子阅读消费调查报告中的相关数据制成扇形统计图,由图可知,下列说法错误的是( )A.扇形统计图能反映各部分在总
5、体中所占的百分比B.每天阅读30分钟以上的居民家庭孩子超过50%C.每天阅读1小时以上的居民家庭孩子占20%D.每天阅读30分钟至1小时的居民家庭孩子对应扇形的圆心角是108【答案】C 【解析】统计图中的扇形统计图。本题是七年级上册第六章第四节统计图的选择的内容,根据居民家庭亲子阅读消费调查报告中的相关数据制成扇形统计图,体现亲子阅读的重要性,灌输阅读要从娃娃抓起的思想.选项分别从扇形统计图的的特点、不同阅读时间所占百分比、通过扇形所占百分比来求扇形圆心角的度数.学生得分率会很高.【例题2】(2019四川自贡)在5轮“中国汉字听写大赛”选拔赛中,甲、乙两位同学的平均分都是90分,甲的成绩方差是
6、15,乙的成绩方差是3,下列说法正确的是()A甲的成绩比乙的成绩稳定B乙的成绩比甲的成绩稳定C甲、乙两人的成绩一样稳定D无法确定甲、乙的成绩谁更稳定【答案】B 【解析】本题主要考查方差,方差是反映一组数据的波动大小的一个量方差越大,则平均值的离散程度越大,稳定性也越小;反之,则它与其平均值的离散程度越小,稳定性越好根据方差的意义求解可得乙的成绩方差甲成绩的方差,乙的成绩比甲的成绩稳定。【例题3】(2019湖南益阳)已知一组数据5,8,8,9,10,以下说法错误的是()A平均数是8B众数是8C中位数是8D方差是8【答案】D【解析】由平均数的公式得平均数(5+8+8+9+10)58,方差(58)2
7、+(88)2+(88)2+(98)2+(108)22.8,将5个数按从小到大的顺序排列为:5,8,8,9,10,第3个数为8,即中位数为8,5个数中8出现了两次,次数最多,即众数为8,故选:D【例题4】(2019眉山)某班七个兴趣小组人数如下:5,6,6,x,7,8,9,已知这组数据的平均数是7,则这组数据的中位数是()A6B6.5C7D8【答案】C【解析】5,6,6,x,7,8,9,这组数据的平均数是7,x77(5+6+6+7+8+9)9,这组数据从小到大排列为:5,6,6,7,8,9,9则最中间为7,即这组数据的中位数是7【例题5】(2019浙江杭州)某计算机程序第一次算得m个数据的平均数
8、为x,第二次算得另外n个数据的平均数为y,则这m+n个数据的平均数等于 【答案】【解析】此题主要考查了加权平均数,正确得出两组数据的总和是解题关键直接利用已知表示出两组数据的总和,进而求出平均数某计算机程序第一次算得m个数据的平均数为x,第二次算得另外n个数据的平均数为y,则这m+n个数据的平均数等于:【例题6】(2019贵阳)如图,下面是甲乙两位党员使用“学习强国APP”在一天中各项目学习时间的统计图,根据统计图对两人各自学习“文章”的时间占一天总学习时间的百分比作出的判断中,正确的是()A甲比乙大B甲比乙小C甲和乙一样大D甲和乙无法比较【答案】A【解析】本题考查的是条形统计图和扇形统计图的
9、综合运用读懂统计图,从不同的统计图中得到必要的信息是解决问题的关键条形统计图能清楚地表示出每个项目的数据;扇形统计图直接反映部分占总体的百分比大小由扇形统计图可知,乙党员学习文章时间的百分比是20%,再由条形统计图求出甲党员学习文章的百分比,进行比较即可由扇形统计图可知,乙党员学习文章时间的百分比是20%,由条形统计图求出甲党员学习文章的百分比是15(15+30+10+5)25%,所以甲党员的百分比比乙党员的百分比大【例题7】(2019山东青岛)为了解学生每天的睡眠情况,某初中学校从全校800名学生中随机抽取了40名学生,调查了他们平均每天的睡眠时间(单位:h),统计结果如下:9,8,10.5
10、,7,9,8,10,9.5,8,9,9.5,7.5,9.5,9,8.5,7.5,10,9.5,8,9,7,9.5,8.5,9,7,9,9,7.5,8.5,8.5,9,8,7.5,9.5,10,9.5,8.5,9,8,9在对这些数据整理后,绘制了如下的统计图表:睡眠时间分组统计表睡眠时间分布情况组别睡眠时间分组人数(频数)17t8m28t91139t10n410t114请根据以上信息,解答下列问题:(1)m,n,a,b;(2)抽取的这40名学生平均每天睡眠时间的中位数落在组(填组别);(3)如果按照学校要求,学生平均每天的睡眠时间应不少于9h,请估计该校学生中睡眠时间符合要求的人数【答案】见解析
11、。【解析】(1)7t8时,频数为m7;9t10时,频数为n18;a100%17.5%;b100%45%;故答案为:7,18,17.5%,45%;(2)由统计表可知,抽取的这40名学生平均每天睡眠时间的中位数为第20个和第21个数据的平均数,落在第3组;故答案为:3;(3)该校学生中睡眠时间符合要求的人数为800440(人);答:估计该校学生中睡眠时间符合要求的人数为440人 专题典型训练题 一、选择题1(2019湖南郴州)下列采用的调查方式中,合适的是()A为了解东江湖的水质情况,采用抽样调查的方式B我市某企业为了解所生产的产品的合格率,采用普查的方式C某小型企业给在职员工做工作服前进行尺寸大
12、小的调查,采用抽样调查的方式D某市教育部门为了解该市中小学生的视力情况,采用普查的方式【答案】A【解答】A.为了解东江湖的水质情况,采用抽样调查的方式,合适;B.我市企业为了解所生产的产品的合格率,因调查范围广,工作量大采用普查的方式不合适;C.某小型企业给在职员工做工作服前进行尺寸大小的调查,因调查范围小采用抽样调查的方式不合适;D.某市教育部门为了解该市中小学生的视力情况,因调查范围广,采用普查的方式不合适。2.(2019江苏无锡)已知一组数据:66,66,62,67,63,这组数据的众数和中位数分别是()A66,62B66,66C67,62D67,66【答案】B 【解析】此题考查了众数和
13、中位数,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数,众数是一组数据中出现次数最多的数把这组数据按照从小到大的顺序排列为:62,63,66,66,67,第3个数是66,所以中位数是66,在这组数据中出现次数最多的是66,即众数是66。3.(2019攀枝花)比较A组、B组中两组数据的平均数及方差,以下说法正确的是()AA组、B组平均数及方差分别相等BA组、B组平均数相等,B组方差大CA组比B组的平均数、方差都大DA组、B组平均数相等,A组方差大【答案】D【解析】由图象可看出A组的数据为:3,3,3,3,3,2,2,2,2,B组的
14、数据为:2,2,2,2,3,0,0,0,0则A组的平均数为A(3+3+3+3+3+2+2+2+2)B组的平均数为B(2+2+2+2+3+0+0+0+0)ABA组的方差S2A(3)2+(3)2+(3)2+(3)2+(3)2+(1)2+(1)2+(1)2+(1)2B组的方差S2B(2)2+(2)2+(2)2+(2)2+(3)2+(0)2+(0)2+(0)2+(0)2S2AS2B综上,A组、B组的平均数相等,A组的方差大于B组的方差。4(2019湖南怀化)抽样调查某班10名同学身高(单位:厘米)如下:160,152,165,152,160,160,170,160,165,159则这组数据的众数是()
15、A152B160C165D170【答案】B【解析】数据160出现了4次为最多,故众数是160。5.(2019广西贺州)一组数据2,3,4,x,6的平均数是4,则x是()A2B3C4D5【答案】D【解析】本题考查了平均数的概念平均数是指在一组数据中所有数据之和再除以数据的个数利用平均数的定义,列出方程4即可求解数据2,3,4,x,6的平均数是4,4,解得:x56(2019宜宾)如表记录了两位射击运动员的八次训练成绩:次数环数运动员第1次第2次第3次第4次第5次第6次第7次第8次甲107788897乙1055899810根据以上数据,设甲、乙的平均数分别为、,甲、乙的方差分别为s甲2,s乙2,则下
16、列结论正确的是()A,s甲2s乙2B,s甲2s乙2C,s甲2s乙2D,s甲2s乙2【答案】A【解析】(1)(10+7+7+8+8+8+9+7)8;(10+5+5+8+9+9+8+10)8;s甲2(108)2+(78)2+(78)2+(88)2+(88)2+(88)2+(98)2+(78)21;s乙2(108)2+(58)2+(58)2+(88)2+(98)2+(98)2+(88)2+(108)2,s甲2s乙27(2019湖南常德)某公司全体职工的月工资如下:月工资(元)18000120008000600040002500200015001200人数1(总经理)2(副总经理)3410202212
17、6该公司月工资数据的众数为2000,中位数为2250,平均数为3115,极差为16800,公司的普通员工最关注的数据是()A中位数和众数B平均数和众数C平均数和中位数D平均数和极差【答案】A【解析】数据的极差为16800,较大,平均数不能反映数据的集中趋势,普通员工最关注的数据是中位数及众数。8(2019湖南岳阳)甲、乙、丙、丁四人各进行了10次射击测试,他们的平均成绩相同,方差分别是S甲21.2,S乙21.1,S丙20.6,S丁20.9,则射击成绩最稳定的是()A甲B乙C丙D丁【答案】C【解析】S甲21.2,S乙21.1,S丙20.6,S丁20.9,S丙2S丁2S乙2S甲2,射击成绩最稳定的
18、是丙,故选:C9.(2019凉山州)某班40名同学一周参加体育锻炼时间统计如表所示:人数(人)317137时间(小时)78910那么该班40名同学一周参加体育锻炼时间的众数、中位数分别是()A17,8.5B17,9C8,9D8,8.5【答案】D【解析】众数是一组数据中出现次数最多的数,即8;由统计表可知,处于20,21两个数的平均数就是中位数,这组数据的中位数为8.5二、填空题10.(2019贵州省安顺市)已知一组数据x1,x2,x3,xn的方差为2,则另一组数据3x1,3x2,3x3,3xn的方差为 【答案】18 【解析】一组数据x1,x2,x3,xn的方差为2,另一组数据3x1,3x2,3
19、x3,3xn的方差为3221811.(2019广西北部湾经济区)甲,乙两人进行飞镖比赛,每人各投6次,甲的成绩(单位:环)为:9,8,9,6,10,6甲,乙两人平均成绩相等,乙成绩的方差为4,那么成绩较为稳定的是_(填“甲”或“乙”)【答案】甲【解析】先计算出甲的平均数,再计算甲的方差,然后比较甲乙方差的大小可判定谁的成绩稳定本题考查方差的定义:一般地设n个数据,x1,x2,xn的平均数为,则方差S2=(x1-)2+(x2-)2+(xn-)2,它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立甲的平均数=(9+8+9+6+10+6)=8,所以甲的方差=(9-8)2+(8-8)2+(9
20、-8)2+(6-8)2+(10-8)2+(6-8)2=,因为甲的方差比乙的方差小,所以甲的成绩比较稳定12(2019湖南常德)从甲、乙、丙三人中选一人参加环保知识抢答赛,经过两轮初赛,他们的平均成绩都是89.7,方差分别是S甲22.83,S乙21.71,S丙23.52,你认为适合参加决赛的选手是 【答案】乙【解析】解:S甲22.83,S乙21.71,S丙23.52,而1.712.833.52,乙的成绩最稳定,派乙去参赛更好。13.(2019四川自贡)在一次有12人参加的数学测试中,得100分、95分、90分、85分、75分的人数分别是1、3、4、2、2,那么这组数据的众数是 分【答案】90 【
21、解析】本题主要考查众数,求一组数据的众数的方法:找出频数最多的那个数据,若几个数据频数都是最多且相同,此时众数就是这多个数据根据众数的定义求解可得这组数据的众数是90分。14(2019湖南郴州)如图是甲、乙两人6次投篮测试(每次投篮10个)成绩的统计图,甲、乙两人测试成绩的方差分别记作s甲2、s乙2,则s甲2 s乙2(填“”,“”或“”)【答案】【解析】解:由图象可知:乙偏离平均数大,甲偏离平均数小,所以乙波动大,不稳定,方差大,即S甲2S乙215.(2019浙江湖州)学校进行广播操比赛,如图是20位评委给某班的评分情况统计图,则该班的平均得分是 分【答案】9.1【解析】直接利用条形统计图以及
22、结合加权平均数求法得出答案该班的平均得分是:(58+89+710)9.1(分)三、解答题16(2019湖南衡阳)进行了统计,并绘制了如下两幅不完整的统计图请结合统计图中的信息解决下列问题:(1)这次学校抽查的学生人数是 ;(2)将条形统计图补充完整;(3)如果该校共有1000名学生,请你估计该校报D的学生约有多少人?【答案】(1)40;(2)见解析;(3)100【解析】(1)这次学校抽查的学生人数是1230%40(人),故答案为:40人;(2)C项目的人数为401214410(人)条形统计图补充为:(3)估计全校报名军事竞技的学生有1000100(人)17. (2019河南)某校为了解七、八年
23、级学生对“防溺水”安全知识的掌握情况,从七、八年级各随机抽取50名学生进行测试,并对成绩(百分制)进行整理、描述和分析部分信息如下:a七年级成绩频数分布直方图:b七年级成绩在70x80这一组的是:70 72 74 75 76 76 77 77 77 78 79c七、八年级成绩的平均数、中位数如下:年级平均数中位数七76.9m八79.279.5根据以上信息,回答下列问题:(1)在这次测试中,七年级在80分以上(含80分)的有人;(2)表中m的值为;(3)在这次测试中,七年级学生甲与八年级学生乙的成绩都是78分,请判断两位学生在各自年级的排名谁更靠前,并说明理由;(4)该校七年级学生有400人,假
24、设全部参加此次测试,请估计七年级成绩超过平均数76.9分的人数【答案】见解析。【解析】本题主要考查频数分布直方图、中位数及样本估计总体,解题的关键是根据直方图得出解题所需数据及中位数的定义和意义、样本估计总体思想的运用(1)在这次测试中,七年级在80分以上(含80分)的有15+823人,故答案为:23;(2)七年级50人成绩的中位数是第25、26个数据的平均数,而第25、26个数据分别为78、79,m77.5,故答案为:77.5;(3)甲学生在该年级的排名更靠前,七年级学生甲的成绩大于中位数78分,其名次在该班25名之前,八年级学生乙的成绩小于中位数78分,其名次在该班25名之后,甲学生在该年
25、级的排名更靠前(4)估计七年级成绩超过平均数76.9分的人数为400224(人)18(2019湖南怀化)某射箭队准备从王方、李明二人中选拔1人参加射箭比赛,在选拔赛中,两人各射箭10次的成绩(单位:环数)如下:次数12345678910王方7109869971010李明89898898108(1)根据以上数据,将下面两个表格补充完整:王方10次射箭得分情况 环数678910频数 频率 李明10次射箭得分情况 环数678910频数 频率 (2)分别求出两人10次射箭得分的平均数;(3)从两人成绩的稳定性角度分析,应选派谁参加比赛合适【答案】(1)见解析;(2)8.5,8.5;(3)李明【解析】(
26、1)环数678910频数12133频率0.10.20.10.30.3李明10次射箭得分情况 环数678910频数00631频率000.60.30.1(2)王方的平均数(6+14+8+27+30)8.5;李明的平均数(48+27+10)8.5;(3)S(68.5)2+2(78.5)2+(88.5)2+3(98.5)2+3(108.5)21.85;S6(88.5)2+3(98.5)2+(108.5)20.35;SS,应选派李明参加比赛合适19(2019山东临沂)争创全国文明城市,从我做起,某学校在七年级开设了文明礼仪校本课程,为了解学生的学习情况,学校随机抽取30名学生进行测试,成绩如下(单位:分
27、)78 83 86 86 90 94 97 92 89 86 84 81 81 84 86 88 92 89 86 83 81 81 85 86 89 93 93 89 85 93整理上面的数据得到频数分布表和频数分布直方图:成绩(分)频数78x82582x86a86x901190x94b94x982回答下列问题:(1)以上30个数据中,中位数是;频数分布表中a;b;(2)补全频数分布直方图;(3)若成绩不低于86分为优秀,估计该校七年级300名学生中,达到优秀等级的人数【答案】见解析。【解析】(1)将各数按照从小到大顺序排列,找出中位数,根据统计图与表格确定出a与b的值即可。根据题意排列得:
28、78,81,81,81,81,83,83,84,84,85,85,86,86,86,86,86,86,88,89,89,89,89,90,92,92,93,93,93,94,97,可得中位数为86,频数分布表中a6,b6;故答案为:86;6;6;(2)补全频数直方图,如图所示:(3)求出样本中游戏学生的百分比,乘以300即可得到结果根据题意得:300190,则该校七年级300名学生中,达到优秀等级的人数为190人20.(2019湖南娄底)“中国梦”是中华民族每一个人的梦,也是每一个中小学生的梦,各中小学开展经典诵读活动,无疑是“中国梦”教育这一宏大乐章里的响亮音符,学校在经典诵读活动中,对全校
29、学生用 A、B、C、D 四个等级进行评价,现从中抽取若干个学生进行调查,绘制出了两幅不完整的统计图,请你根据图中信息解答下列问题:(1)共抽取了多少个学生进行调查?(2)将图甲中的折线统计图补充完整(3)求出图乙中 B 等级所占圆心角的度数【答案】(1)50;(2)见解析;(3)144 【解析】(1)1020%=50,所以抽取了 50 个学生进行调查;(2)B 等级的人数=5015105=20(人),画折线统计图;(3)图乙中 B 等级所占圆心角的度数=360=14421(2019湖南湘西州)“扫黑除恶”受到广大人民的关注,某中学对部分学生就“扫黑除恶”知识的了解程度,采用随机抽样调查的方式,
30、并根据收集到的信息进行统计,绘制了下面两幅尚不完整的统计图,请你根据统计图中所提供的信息解答下列问题:(1)接受问卷调查的学生共有 人,扇形统计图中“很了解”部分所对应扇形的圆心角为 ;(2)请补全条形统计图;(3)若该中学共有学生900人,请根据上述调查结果,估计该中学学生中对“扫黑除恶”知识达到“很了解”和“基本了解”程度的总人数【答案】(1)60,108;(2)见解析;(3)72【解析】(1)接受问卷调查的学生共有:1830%60(人);扇形统计图中“很了解”部分所对应扇形的圆心角为:36030%108;故答案为:60,108;(2)60391830;补全条形统计图得:(3)根据题意得:
31、900720(人),则估计该中学学生中对校园安全知识达到“很了解”和“基本了解”程度的总人数为72人22(2019湖南益阳)某校数学活动小组对经过某路段的小型汽车每车乘坐人数(含驾驶员)进行了随机调查,根据每车乘坐人数分为5类,每车乘坐1人、2人、3人、4人、5人分别记为A、B、C、D、E,由调查所得数据绘制了如图所示的不完整的统计图表类别频率AmB0.35C0.20DnE0.05(1)求本次调查的小型汽车数量及m,n的值;(2)补全频数分布直方图;(3)若某时段通过该路段的小型汽车数量为5000辆,请你估计其中每车只乘坐1人的小型汽车数量【答案】(1)160;(2)见解析;(3)1500辆【
32、解析】解:(1)本次调查的小型汽车数量为320.2160(辆),m481600.3,n1(0.3+0.35+0.20+0.05)0.1;(2)B类小汽车的数量为1600.3556,D类小汽车的数量为0.116016,补全图形如下:(3)估计其中每车只乘坐1人的小型汽车数量为50000.31500(辆)23(2019成都)随着科技的进步和网络资源的丰富,在线学习已经成为更多人的自主学习选择某校计划为学生提供以下四类在线学习方式:在线阅读、在线听课、在线答题和在线讨论为了解学生需求,该校随机对本校部分学生进行了“你对哪类在线学习方式最感兴趣”的调查,并根据调查结果绘制成如下两幅不完整的统计图根据图中信息,解答下列问题:(1)求本次调查的学生总人数,并补全条形统计图;(2)求扇形统计图中“在线讨论”对应的扇形圆心角的度数;(3)该校共有学生2100人,请你估计该校对在线阅读最感兴趣的学生人数【答案】见解析。【解析】(1)本次调查的学生总人数为:1820%90,在线听课的人数为:9024181236,补全的条形统计图如右图所示;(2)扇形统计图中“在线讨论”对应的扇形圆心角的度数是:36048,即扇形统计图中“在线讨论”对应的扇形圆心角的度数是48;(3)2100560(人),答:该校对在线阅读最感兴趣的学生有560人