3.2.1独立性检验的基本思想及其初步应用(学、教案)
3. 2.1独立性检验的基本思想及其初步应用
教学目标
(1)通过对典型案例的探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用; (2)经历由实际问题建立数学模型的过程,体会其基本方法。
教学重点:独立性检验的基本方法 教学难点:基本思想的领会及方法应用 教学过程 一、问题情境 5月31日是世界无烟日。有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题: 某医疗机构为了了解肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965个人,其中吸烟者2148人,不吸烟者7817人。调查结果是:吸烟的2148人中有49人患肺癌,2099人未患肺癌;不吸烟的7817人中有42人患肺癌,7775人未患肺癌。 问题:根据这些数据能否断定“患肺癌与吸烟有关”? 二、学生活动 (1)引导学生将上述数据用下表(一)来表示:(即列联表) 不吸烟 吸烟 总计 不患肺癌 7775 2099 9874 患肺癌 42 49 91 总计 7817 2148 9965 (2)估计吸烟者与不吸烟者患肺癌的可能性差异: 在不吸烟者中,有≈0.54%的人患肺癌; 在吸烟的人中,有≈2.28%的人患肺癌。 问题:由上述结论能否得出患肺癌与吸烟有关?把握有多大? 三、建构数学
1、从问题“吸烟是否与患肺癌有关系”引出独立性检验的问题,借助样本数据的列联表,柱形图和条形图的展示,使学生直观感觉到吸烟和患肺癌可能会有关系。但这种结论能否推广到总体呢?要回答这个问题,就必须借助于统计理论来分析。 2、独立性检验:
(1)假设H0:患肺癌与吸烟没有关系。即:“吸烟与患肺癌相互独立”。用A表示不吸烟,B表示不患肺癌,则有P(AB)=P(A)P(B)
若将表中“观测值”用字母代替,则得下表(二): 患肺癌 未患肺癌 2019-8-5
合计
吸烟 不吸烟 合计 学生活动:让学生利用上述字母来表示对应概率,并化简整理。 思考交流:|adbc|越小,说明患肺癌与吸烟之间的关系越(强、弱)?
n(adbc)2(2)构造随机变量K(其中nabcd)
(ab)(cd)(ac)(bd)2由此若H0成立,即患肺癌与吸烟没有关系,则K的值应该很小。把表中的数据代入计算得K的观测值k约为
2
2
56.632,统计学中有明确的结论,在H0成立的情况下,随机事件P(K≥6.635)≈0.01。由此,我们有99%的把
2
握认为H0不成立,即有99%的把握认为“患肺癌与吸烟有关系”。 上面这种利用随机变量K来确定是否能以一定把握认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验。 说明:估计吸烟者与不吸烟者患肺癌的可能性差异是用频率估计概率,利用K进行独立性检验,可以对推断的正确性的概率作出估计,观测数据a,b,c,d取值越大,效果越好。在实际应用中,当a,b,c,d均不小于5,近似的效果才可接受。 (2)这里所说的“患肺癌与吸烟有关系”是一种统计关系,这种关系是指“抽烟的人患肺癌的可能性(风险)更大”,而不是说“抽烟的人一定患肺癌”。 (3)在假设H0成立的情况下,统计量K应该很小,如果由观测数据计算得到K的观测值很大,则在一定程度2222上说明假设不合理(即统计量K越大,“两个分类变量有关系”的可能性就越大)。 3、对于两个分类变量A和B,推断“A和B有关系”的方法和步骤为: 2①利用三维柱形图和二维条形图; ②独立性检验的一般步骤: 第一步,提出假设H0:两个分类变量A和B没有关系; 第二步,根据2×2列联表和公式计算K2统计量; 第三步,查对课本中临界值表,作出判断。 4、独立性检验与反证法: 反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立; 独立性检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这
个假设不成立。
四、数学运用
例1在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶.分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?
①第一步:教师引导学生作出列联表,并分析列联表,引导学生得出“秃顶与患心脏病有关”的结论;
第二步:教师演示三维柱形图和二维条形图,进一步向学生解释所得到的统计结果; 2019-8-5
第三步:由学生计算出K2的值; 第四步:解释结果的含义.
②通过第2个问题,向学生强调“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广. 变式练习:课本P97练习
【板书设计】:
【作业布置】:课本P97习题3.2第1题
2019-8-5
3.2.1独立性检验的基本思想及其初步应用
课前预习
阅读教材P91-P95,了解相关概念,如:分类变量、列联表、独立性检验。 学习目标
(1)通过对典型案例的探究,了解独立性检验(只要求22列联表)的基本思想、
方法及初步应用;
(2)经历由实际问题建立数学模型的过程,体会其基本方法。 学习重点:独立性检验的基本方法 学习难点:基本思想的领会 学习过程 一、情境引入 5月31日是世界无烟日。有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题: 某医疗机构为了了解肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965个人,其中吸烟者2148人,不吸烟者7817人。调查结果是:吸烟的2148人中有49人患肺癌,2099人未患肺癌;不吸烟的7817人中有42人患肺癌,7775人未患肺癌。
问题:根据这些数据能否断定“患肺癌与吸烟有关”? 二、学生活动 【自主学习】 (1)将上述数据用下表(一)来表示: 不患肺癌 不吸烟 吸烟 总计 患肺癌 总计 (2)估计吸烟者与不吸烟者患肺癌的可能性差异: 在不吸烟者中患肺癌的人约占多大比例?; 在吸烟的人中患肺癌的人约占多大比例?。
问题:由上述结论能否得出患肺癌与吸烟有关?把握有多大? 【合作探究】
1、观察、分析样本数据的列联表和柱形图、条形图,你能得出什么结论? 2、该结论能否推广到总体呢?
2019-8-5
3、假设H0:患肺癌与吸烟没有关系。则两事件发生的概率有何关系?
不患肺癌 不吸烟 吸烟 总计 a c a+c 患肺癌 b d b+d 总计 a+b c+d a+b+c+d 试用上表(二)中字母表示两概率及其关系,并化简该式。你能得到何结论?
n(adbc)24、构造随机变量K(其中nabcd),结合
(ab)(cd)(ac)(bd)23中结论,
若H0成立,则K2应该很(大、小) 根据表(一)中的数据,利用4中公式,计算出K2的观测值,该值说明什么?(统计学中有明确的结论,在H0成立的情况下,P(K2≥6.635)≈0.01。) 5、结合表(二)和三维柱形图、二维条形图如何判断两个分类变量是否有关系?利用独立性检验呢?二者谁更精确? 【当堂检测】 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶.分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系? 学校:二中学科:数学编写人:游恒涛审稿人:马英济 3.2.2独立性检验的基本思想及其初步应用 教学目标
通过对典型案例的探究,进一步巩固独立性检验的基本思想、方法,并能运用K2进行独立性检验.
教学重点:独立性检验的基本方法 教学难点:基本思想的领会及方法应用 教学过程 一.学生活动 练习: (1)某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据?女教授人数,男教授人数,女副教授人数,男副教授人数。
(2)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
为了判断主修统计专业是否与性别有关系,专业 非统计专业 统计专业 根据表中的数据,得到 性别 K213 10 男 50(1320107)27 20 女 4.844,∵23272030K23.841,
所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为.(答案:5%) 附:临界值表(部分): 20.10 0.05 0.025 0.010 P(K≥2019-8-5
k0) k0 2.706 3.841 5.024 6.635 二.数学运用 例1为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表: 男 女 总 计 喜欢数学课程 37 35 72 不喜欢数学课程 85 143 228 总 计 122 178 300 由表中数据计算得到K2的观察值k4.514.在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么? (学生自练,教师总结) 强调:①使得P(K23.841)0.05成立的前提是假设“性别与是否喜欢数学课程之间没有关系”.如果这个前提不成立,上面的概率估计式就不一定正确; ②结论有95%的把握认为“性别与喜欢数学课程之间有关系”的含义; ③在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算K2的值解决实际问题,而没有必要画相应的图形,但是图形的直观性也不可忽视. 例2、为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示。根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论? 口服 注射 合计 有效 58 64 122 无效 40 31 71 合计 98 95 193 分析:在口服的病人中,有586459%的人有效;在注射的病人中,有67%的人有效。从直观9895上来看,口服与注射的病人的用药效果的有效率有一定的差异,能否认为用药效果与用药方式一定有关呢?下面用独立性检验的方法加以说明。
说明:如果观测值K2≤2.706,那么就认为没有充分的证据显示“A与B有关系”,但也不能
作出结论“H0成立”,即A与B没有关系 小结:独立性检验的方法、原理、步骤 三、巩固练习:
某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况与生理健康有关”?
2019-8-5
不优秀 优 秀 总 计 不健康 41 37 78 626 296 922 667 333 1000 健 康 总计 2019-8-5
3.2.2独立性检验的基本思想及其初步应用
学习目标
通过对典型案例的探究,进一步巩固独立性检验的基本思想、方法,并能运用K进行独立性检验.
2
学习重点:独立性检验的应用 学习过程 一.前置测评
(1)某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据?。 (2)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
为了判断主修统计专业是否与性别有关系,专业 非统计专业 统计专业 根据表中的数据,得到 性别 K2男 13 10 50(1320107)2女 7 20 4.844,∵K2≥
232720303.841, 所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为。 附:临界值表(部分): 2 P(K≥k0)0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 k0 二.典型例题 例1为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表: 男 女 总 计 喜欢数学课程 37 35 72 不喜欢数学课程 85 143 228 总 计 122 178 300 由表中数据计算得到K2的观察值k≈4.514.在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么? 例2、为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示。根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论? 口服 注射 合计 有效 58 64 122 无效 40 31 71 合计 98 95 193 谈一谈:结合例1和例2你如何理解独立性检验。 三、巩固练习:
某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况与生理健康有关”?
2019-8-5
不优秀 优 秀 总 计 不健康 41 37 78 健 康 总计 626 296 922 667 333 1000 2019-8-5
因篇幅问题不能全部显示,请点此查看更多更全内容