1、31 独立性检验独立性检验 学习目标 1.了解 22 列联表的意义.2.了解统计量 2的意义.3.通过对典型案例分析,了解 独立性检验的基本思想和方法 知识点一 22 列联表 思考 山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的 课外活动方式,结果整理成下表: 体育 文娱 合计 男生 210 230 440 女生 60 290 350 合计 270 520 790 如何判定“喜欢体育还是文娱与性别是否有联系”? 答案 可通过表格与图形进行直观分析,也可通过统计分析定量判断 梳理 (1)22 列联表的定义 对于两个研究对象和,有两类取值,即类 A 和类 B;也有两类取
2、值,即类 1 和类 2. 我们得到如下列联表所示的抽样数据: 类 1 类 2 合计 类 A a b ab 类 B c d cd 合计 ac bd abcd (2)2统计量的求法 公式 2 nadbc2 abcdacbd. 知识点二 独立性检验 独立性检验的概念 用 2统计量研究两变量是否有关的方法称为独立性检验 知识点三 独立性检验的步骤 1独立性检验的步骤 要判断“与有关系”,可按下面的步骤进行: (1)提出假设 H0:与没有关系; (2)根据 22 列联表及 2公式,计算 2的值; (3)查对临界值,作出判断 其中临界值如表所示: P(2 x0) 0.50 0.40 0.25 0.15 0
3、.10 0.05 0.025 0.010 0.005 0.001 x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 表示在 H0成立的情况下,事件“2x0”发生的概率 2推断依据 (1)若 210.828,则有 99.9%的把握认为“与有关系”; (2)若 26.635,则有 99%的把握认为“与有关系”; (3)若 22.706,则有 90%的把握认为“与有关系”; (4)若 22.706,则认为没有充分的证据显示“与有关系”,但也不能作出结论“H0成 立”,即不能认为与没有关系 1列联表中的数据是两个分类变量的频
4、数( ) 2事件 A 与 B 的独立性检验无关,即两个事件互不影响( ) 32的大小是判断事件 A 与 B 是否相关的统计量( ) 类型一 22 列联表 例 1 在一项有关医疗保健的社会调查中,发现调查的男性为 530 人,女性为 670 人,其中 男性中喜欢吃甜食的为 117 人,女性中喜欢吃甜食的为 492 人,请作出性别与喜欢吃甜食的 人数的列联表 考点 题点 解 作列联表如下: 喜欢甜食 不喜欢甜食 合计 男 117 413 530 女 492 178 670 合计 609 591 1 200 反思与感悟 分清类别是作列联表的关键步骤表中排成两行两列的数据是调查统计得来的 结果 跟踪训
5、练 1 (1)下面是 22 列联表: y1 y2 合计 x1 a 21 73 x2 2 25 27 合计 b 46 100 则表中 a,b 的值分别为_ 答案 52 54 解析 a2173,a52. 又a2b,b54. (2)某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的 426 名学生中有 332 名在考前心情紧张,性格外向的 594 名学生中有 213 名在考前心情紧张作出 22 列联 表 考点 题点 解 作列联表如下: 性格内向 性格外向 合计 考前心情紧张 332 213 545 考前心情不紧张 94 381 475 合计 426 594 1 020 类型二 由 2进
6、行独立性检验 例 2 对 196 个接受心脏搭桥手术的病人和 196 个接受血管清障手术的病人进行三年的跟踪 研究,调查他们是否又发作过心脏病,调查结果如下表所示. 又发作过 心脏病 未发作过心脏病 合计 心脏搭桥手术 39 157 196 血管清障手术 29 167 196 合计 68 324 392 试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别 考点 独立性检验及其基本思想 题点 独立性检验的方法 解 假设病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术没有关系,由表中数据 得 a39,b157,c29, d167, ab196,cd196,ac68,bd324,
7、n392, 由公式得 23923916715729 2 19619668324 1.779. 因为 21.7792.706,所以不能得出病人又发作过心脏病与做过心脏搭桥手术还是血管清障 手术有关系的结论,即这两种手术对病人又发作过心脏病的影响没有差别 反思与感悟 独立性检验的关注点 在 22 列联表中,如果两个分类变量没有关系,则应满足 adbc0,因此|adbc|越小, 关系越弱;|adbc|越大,关系越强 跟踪训练 2 某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情 况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查 了 50 人,其中有
8、老教师 20 人,青年教师 30 人老教师对新课程教学模式赞同的有 10 人, 不赞同的有 10 人;青年教师对新课程教学模式赞同的有 24 人,不赞同的有 6 人 (1)根据以上数据建立一个 22 列联表; (2)判断是否有 99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系 考点 独立性检验及其基本思想 题点 独立性检验的方法 解 (1)22 列联表如下所示: 赞同 不赞同 合计 老教师 10 10 20 青年教师 24 6 30 合计 34 16 50 (2)假设“对新课程教学模式的赞同情况与教师年龄无关” 由公式得 2501062410 2 34162030 4.9636.63
9、5, 所以没有 99%的把握认为对新课程教学模式的赞同情况与教师年龄有关 类型三 独立性检验的综合应用 例 3 电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了 100 名 观众进行调查, 并根据调查结果绘制了观众日均收看该体育节目时间的频率分布直方图如图 将日均收看该体育节目时间不低于 40 分钟的观众称为“体育迷” (1)根据已知条件完成下面的 22 列联表,并据此资料推断“体育迷”与性别是否有关? 非体育迷 体育迷 合计 男 女 10 55 合计 (2)将上述调查所得的频率视为概率现在从该地区大量电视观众中,采用随机抽样方法每次 抽取 1 名观众,抽取 3 次,记被抽
10、取的 3 名观众中的“体育迷”人数为 X.若每次抽取的结果 是相互独立的,求 X 的概率分布、均值 E(X)和方差 V(X) 附:2 nadbc2 abcdacbd. P(2x0) 0.10 0.05 0.01 x0 2.706 3.841 6.635 考点 独立性检验及其基本思想 题点 独立性检验的方法 解 (1)由频率分布直方图可知,在抽取的 100 人中,“体育迷”有 25 人,从而 22 列联表 如下: 非体育迷 体育迷 合计 男 30 15 45 女 45 10 55 合计 75 25 100 将 22 列联表中的数据代入公式计算,得 210030104515 2 75254555
11、100 33 3.030. 因为 2.7063.0303.841,故能在犯错误的概率不超过 0.05 的前提下认为“两个学校的数学成绩有差 异”. 1在一项打鼾与患心脏病的调查中,共调查了 1 671 人,经过计算 227.63,根据这一数 据分析,我们有理由认为打鼾与患心脏病是_的(填有关或无关) 考点 题点 答案 有关 2 为了考察长头发与女性头晕是否有关系, 随机抽查了 301 名女性, 得到如下所示的列联表, 试根据表格中已有数据填空 经常头晕 很少头晕 合计 长发 35 121 短发 37 143 合计 72 则空格中的数据分别为:_;_;_;_. 考点 题点 答案 86 180 2
12、29 301 3在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是_(填序号) 若 26.635,我们有 99%的把握认为吸烟与患肺病有关系,那么在 100 个吸烟的人中必有 99 人患有肺病; 从独立性检验可知,有 99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他 有 99%的可能患有肺病; 若从 2与临界值的比较中得出有 95%的把握认为吸烟与患肺病有关系,是指有 5%的可能 性使得推断出现错误 考点 题点 答案 解析 对于,99%的把握是通过大量的试验得出的结论,这 100 个吸烟的人中可能全患肺 病也可能都不患,是随机的,所以错;对于,某人吸烟只能说其患病的可能性较大,
13、并 不一定患病;的解释是正确的 4某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具 体数据如表: 患心脏病 无心脏病 合计 秃发 20 300 320 不秃发 5 450 455 合计 25 750 775 根据表中数据得到 2775204505300 2 25750320455 15.968,因为 26.635,则断定秃发与患 心脏病有关系,那么这种判断出错的可能性为_ 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 0.01 解析 因为 26.635,所以有 99%的把握说秃发与患心脏病有关,故这种判断出错的可能性 有 10.990.01. 5根据下表计算: 不看电视 看电视 合计 男 37 85 122 女 35 143 178 合计 72 228 300 2_.(保留 3 位小数) 考点 题点 答案 4.514 解析 2300371438535 2 12217872228 4.514. 122 列联表 22 列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有相关关系 2对独立性检验思想的理解 独立性检验的基本思想类似于数学中的反证法先假设“两个分类变量没有关系”成立,计 算 2统计量的值,如果 2的值很大,说明假设不合理2越大,两个分类变量有关系的可能 性越大