第04讲列联表与独立性检验(原题版).docx
备战2024年高考解读突破强化一轮复习讲义(新高考)第04讲列联表与独立性检验【考试要求】1 .掌握分类变量的含义.2 .通过实例,理解2X2列联表的统计意义.3 .通过实例,了解2X2列联表独立性检验及其应用.知识点一分类变量与列联表(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量;(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和匕X表示相互对立的两个事件=0和=I,Y表示相互对立的两个事件y=0和y=1,其中内b,C,d是事件X=x,Y=y(x,y=0,1)的频数,是样本量,其样本频数列联表(称为2X2列联表)如表所示:XY合计Y=Oy=X=OahabX=Cdc+d合计a+cb+d=+6+c+d知识点二独立性检验(1)小概率值。的临界值:对于任何小概率值。,可以找到相应的正实数总,使得关系P(2xJ=。成立.我们称Xa为的临界值,这个临界值可作为判瞰2大小的标准.概率值夕越小,临界值Xa越大;(2)炉的计算公式:* =Mad-be?(。+力(c*Xo+c)(6+<)'(3)独立性检验:利用炉的取值推断分类变量X和y是否独立的方法称为必独立性检验,读作“卡方独立性检验”,简称独立性检验;(4)基于小概率值的检验规则:当222%时,我们就推断办不成立,即认为X和丫不独立,该推断犯错误的概率不超过防当时,我们没有充分证据推断Ho不成立,可以认为X和y独立(其中Xa为的临界值);(5)应用独立性检验解决实际问题的主要环节:提出零假设“0:X和y相互独立,并给出在问题中的解释;根据抽样数据整理出2X2列联表,计算犬的值,并与临界值Xa比较;根据检验规则得出推断结论;在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和丫间的影响规律.(6)独立性检验中几个常用的小概率值和相应的临界值:a0.10.050.010.0050.001Xa2.7063.8416.6357.87910.8281 .下列判断正确的是()A分类变量中的变量与函数的变量是同一-概念.()B等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验中炉取值则可通过统计表从数据上说明两分类变量的相关性的大小.()C独立性检验的方法就是用的反证法.()D/的大小是判断事件力与B是否相关的统计量.()2 .观察下面各等高堆积条形图,其中两个分类变量关系最强的是()3 .(多选)若在研究吸烟与患肺癌的关系中,通过收集、整理、分析数据得“吸烟与患肺癌有关''的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是()A.在犯错误的概率不超过0.01的前提下,认为吸烟和患肺癌有关系B.1个人吸烟,那么这个人有99%的概率患有肺癌4 .下面是一个2×2列联表:XY合计刃yXia2173X2222547合计b46120则表中的d=,b=.X,丫,由它们的样本数据计算得到z24.328,Z2的部分临界值表如下:aXa则最大有的把握说变量X,Y有关系(填百分数).考点一等高条形图例12018年12月28日,广州市地铁14号线开通,在一定程度上缓解从化到广州市区交通的拥堵,为了了解市民对地铁14号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析了其年龄和性别结构,并制作出如下等高条形图:根据图中(35岁以上含35岁)的信息,下列结论不一定正确的是()A.样本中男性比女性更关注地铁14号线开通B.样本中多数女性是35岁以上C.样本中35岁以下的男性人数比35岁以上的女性人数多D.样本中35岁以上的人对地铁14号线的开通的关注度更高【对点演练1】(多选)根据如图所示的等高堆积条形图,下列叙述正确的是()A.吸烟患肺病的频率约为0.2B.吸烟不患肺病的频率约为0.8C.不吸烟患肺病的频率小于0.05D.吸烟与患肺病无关系【对点演练2】(2022下山东临沂高二统考期中)某校为研究该校学生性别与体育锻炼的经常性之间的联系,随机抽取100名学生(其中男生60名,女生40名),并绘制得到如图所示的等高堆积条形图,则这100名学生中经常锻炼的人数为.知识点二列联表例2.(2022下海南高二统考期末)为考查某种营养品对儿童身高增长的影响,用一部分儿童进行试验,根据100个有放回简单随机样本的数据,得到如下列联表:由表可知下列说法正确的是()身高合计有明显增长无明显增长食用该营养品a1050未食用该营养品b3050合计6040100参考公式:参=(”人工)(工)9+4,其中+Hc+d.B.212.667C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是1D.根据小概率值=0.001的独立性检验,可以认为该营养品对儿童身高增长有影响【对点演练1】(2023云南昆明校联考一模)考查棉花种子经过处理跟生病之间的关系得到如表数据:项目种子处理种子未处理总计得病32101133不得病192213405总计224314538根据以上数据,则()A.种子是否经过处理决定是否生病B.种子是否经过处理跟是否生病无关C种子是否经过处理跟是否生病有关D.以上都是错误的【对点演练2】(2024高三课时练习)如表是一个2x2列联表,则表中b的值分别为()y2合计王a2173巧222547合计b46120A.94,72B.52,50C.52,74D.74,52考点三独立性检验角度1独立性检验思想的辨析例3(2023上全国高三专题练习)下列关于独立性检验的说法正确的是()A.独立性检验是对两个变量是否具有线性相关关系的一种检验B.独立性检验可以100%确定两个变量之间是否具有某种关系C.利用/独立性检验推断吸烟与患肺病的关联中,根据小概率值=0.0i的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在100个吸烟的人中,有99人患肺病D.对于独立性检验,随机变量/的值越小,判定”两变量有关系”犯错误的概率越大【对点演练1】(2022上广东东莞高三校考阶段练习)根据分类变量X与V的观测数据,计算得到/=3.974.依据=0.05的独立性检验,结论为()a0.10.050.010.0050.0012.7063.8416.6357.87910.828A.变量X与歹不独立,这个结论犯错误的概率不超过0.01B.变量X与N不独立,这个结论犯错误的概率不超过0.05c.变量X与y独立,这个结论犯错误的概率不超过0.05D.变量X与丁独立,这个结论犯错误的概率不超过0.01【对点演练2】(2023陕西榆林统考三模)若由个2x2列联表中的数据计算得K2=3,A.能有95%的把握认为这两个变量有关系B.能有95%的把握认为这两个变量没有关系C.能有97.5%的把握认为这两个变量有关系D.能有97.5%的把握认为这两个变量没有关系【对点演练3】(2023上全国高三专题练习)(多选)根据分类变量X与y的观察数据,计算得到/=2.974,依据表中给出的/独立性检验中的小概率值和相应的临界值,作出下列判断,A.根据小概率值a=0.05的独立性检验,分析变量X与y相互独立B.根据小概率值=0.05的独立性检验,分析变量X与y不相互独立C.变量X与yD.变量X与y角度2卡方的计算与应用例4.(2023全国模拟预测)某超市对一种商品受顾客的喜爱程度进行100份问卷调查,得2到了如下的2x2列联表,从100人中随机抽取1人,抽到喜爱该商品的男顾客的概率为不喜爱该商品不喜爱该商品合计男顾客10女顾客35合计100则有超过()的把握认为喜爱该商品与性别有关.下面的临界值表供参考:C. 90%D. 95%【对点演练1】(2023上全国高三专题练习)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失):被某病毒感染未被某病毒感染合计注射疫苗1050未注射疫苗3050合计30100计算可知,根据小概率值Q =的独立性检验,分析”给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果"()Mad - bc)( + 6)(c + d)( + c)(b + d),“=+>+c+d.附:Z角度3根据结论求参数(范围)例5. (2020河南濮阳统考二模)2020年2月,全国掀起了 “停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为()n(ad -be附.a+b)(c + d)(a + c)(b + d ),其中 = +b + c + d.【对点演练1】在研究某高中高三年级学生的性别与是否喜欢某学科的关系时,总共调查了N个学生(N=10011M"cN.),其中男女学生各半,男生中60%表示喜欢该学科,其余表示不喜欢;女生中40%表示喜欢该学科,其余表示不喜欢.若有99.9%把握认为性别与是否喜欢该学科有关,则可以推测N的最小值为()n(ad-be)2(a+b)(c+d)a+c)(b+d)附K? =A. 400C. 200D. 100B.300【对点演练2】(2023上陕西高三校联考阶段练习)第19届亚运会将于2023年9月23日至10月8日在杭州举行,某网络直播平台调研”大学生是否喜欢观看体育比赛直播与性别有关"从某高校男、女生中各随机抽取100人进行问卷调查,得到如下数据(5m15"N).喜欢观看不喜欢观看男生80-/H20+w女生50+zw50-/W通过计算,有95%以上的把握认为大学生喜欢观看直播体育比赛与性别有关,则在被调查的100名女生中喜欢观看体育比赛直播的人数的最大值为()Mad-bc)(+Z>)(c+6/)(a+c)(b+d)C. 58D. 60角度4独立性检验思想的实际应用例6(2022全国甲卷政编)甲、乙两城之间的长途客车均由4和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)根据小概率值=0.1的独立性检验,能否认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?n(ad-l>c(a+6)(c*)(a+c)(6÷J)'Q0.1000.0500.0102.7063.8416.635【对点演练1】(2023上全国高三专题练习)(多选)“一粥饭,当思来之不易”,道理虽简单,但每年我国还是有2000多亿元的餐桌浪费,被倒掉的食物相当于2亿多人一年的口粮.为营造“节约光荣,浪费可耻”的氛围,某市发起了“光盘行动”.某机构为调研民众对“光盘行动”的认可情况,在某大型餐厅中随机调查了90位来店就餐的客人,制成如下所示的列联表,通过计算得到K2的观测值为9认可不认可40岁以下202040岁以上(含40岁)4010已知尸(二.6.635)=0.010,P(.10.828)=0.001,则下列判断正确的是()A.在该餐厅用餐的客人中大约有66.7%的客人认可"光盘行动”B.在该餐厅用餐的客人中大约有99%的客人认可"光盘行动”C.根据小概率值=0.01的独立性检验,认为"光盘行动”的认可情况与年龄有关D.根据小概率值=0001的独立性检验,认为"光盘行动”的认可情况与年龄有关【对点演练2】为推行“新课堂”教学法,某化学老师分别用传统教学和“新课堂”两种不同的教学方式,在甲、乙两个平行班级进行教学实验.为了比较教学效果,期中考试后,分别从两个班级中各随机抽取20名学生的成绩进行统计,结果如下表.记成绩不低于70分的为“成绩优良”.分数50,60)60,70)70,80)80,90)90,100甲班频数56441乙班频数13655由以上统计数据列出2×2列联表,并判断能否依据小概率值我独立性检验认为“成绩优良与教学方式有关”.1.下面是一个2x2列联表,其中如6处填的值分别为()凹y2总计演a2173演22527总计b46100A.52、54B. 54、52C. 94、146D. 146、942.对甲、乙两个班级学生的数学考试成绩按照优秀和不优秀统计人数后,得到如下的列联表,则Z2约为()班级数学成绩合计优秀不优秀甲班113445乙班83745合计1971903.为考察48两种药物预防某疾病的效果,进行药物实验,分别得到如下等高堆积条形图:根据图中信息,在下列各项中,说法最佳的一项是()B的预防效果优于药物A的预防效果A的预防效果优于药物B的预防效果A,8对该疾病均有显著的预防效果A,8对该疾病均没有预防效果4 .两个分类变量X和匕值域分别为m,&和yi,冲,其样本频数分别是=10,6=21,C+dX与Y有关系的可信程度不小于97.5%,则C=()5 .(2022上黑龙江牡丹江高三牡丹江市第二高级中学校考阶段练习)某课外兴趣小组通过随机调查,利用2x2列联表和犬K=6.748,经查阅临界值表知P(Y6.635)=0.010,则下列判断正确的是()A.每100个数学成绩优秀的人中就会有1名是女生C.有99%的把握认为“数学成绩优秀与性别无关”D.在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关“6 .(2023上全国高三专题练习)2020年以来,为了抗击新冠肺炎疫情,教育部出台了“停课不停学"政策,全国各地纷纷采取措施,通过网络进行教学,为莘莘学子搭建学习的平台.在线教育近几年蓬勃发展,为学生家长带来了便利,节省了时间,提供了多样化选择,满足了不同需求,也有人预言未来的教育是互联网教育.与此同时,网课也存在以下一些现象,自觉性不强的孩子网课学习的效果大打折扣,授课教师教学管理的难度增大.基于以上现象,开学后某学校对本校课学习情况进行抽样调查,抽取25名女生,25名男生进行测试、问卷等,调查结果形成以下2x2列联表,通过数据分析,认为认真参加网课与学生性别之间(参考数据:认真上网课不认真上网课合计男生52025女生151025合计203050A.不能根据小概率的=0.05的z2独立性检验认为两者有关B.根据小概率的=0.01的/独立性检验认为两者有关C.根据小概率的Q=0.001的/独立性检验认为两者有关D.根据小概率的=0.05的Z2独立性检验认为两者无关7 .(2023山东荷泽统考二模)足球是一项大众喜爱的运动,为了解喜爱足球是否与性别有关,随机抽取了若干人进行调查,抽取女性人数是男性的2倍,男性喜爱足球的人数占男性人数的O女性喜爱足球的人数占女性人数的;,若本次调查得出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关"的结论,则被调查的男性至少有()人C. 12D. 138 .(多选)(2023上全国高三专题练习)炎炎夏日,许多城市发出高温预警,凉爽的昆明成为众多游客旅游的热门选择,为了解来昆明旅游的游客旅行方式与年龄是否有关,随机调查了100名游客,得到如下2x2列联表,零假设为".:旅行方式与年龄没有关联,则下列说法正确的有()自由行3819跟团游2023小于40岁不小于40岁附:上(布)(二嬴?C)(H”其中=KHC+"19A.在选择自由行的游客中随机抽取一名,其小于40岁的概率为弓B.在选择自由行的游客中按年龄分层抽样抽取6人,再从中随机选取2人做进步的访谈,则所选2人中至少有1人不小于40岁的概率为gC.根据=0.01D.根据=0.059 .(多选)(2023全国高二专题练习)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”"日落云里走,雨在半夜后”.小波同学为了验证”日落云里走,雨在半夜后",观察了N地区的100天日落和夜晚天气,得到如下2x2列联表,并计算得到z2M9.05,下列小波对力地区天气的判断正确的是()日落云里走夜晚天气下雨未下雨出现255未出现2545A.夜晚下雨的概率约为去B.未出现"日落云里走",夜晚下雨的概率约为三C.依据=0005的独立性检验,认为"日落云里走”是否出现与夜晚天气有关D.依据=0.005的独立性检验,若出现”日落云里走“,则认为夜晚一定会下雨10. (2019上四川资阳高三统考阶段练习)如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400名(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层抽样的方法抽取23人,则抽取的男生人数为.11. (2023上全国高三专题练习)已知尸(6.635)=0.01,P(10.828)=0.001.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到z2=7235,则根据小概率值=的/独立性检验,分析喜欢该项体育运动与性别有关.12. (2023上高二课时练习)某研究小组为了研究中学生的身体发育情况,在某学校随机抽取20名15至16周岁的男生,将他们的身高和体重制成2x2的列联表,根据列联表的数据,可以在犯错误的概率不超过的前提下认为该学校15至16周岁的男生的身高与体重之间有关系.身高超重偏高4不偏高3总计7体重不超重总计1512151320附表:13. (2023四川绵阳四川省绵阳南山中学校考模拟预测)针对"中学生追星问题”,某校团委对"学生性别和中学生追星是否有关“作了一次调查,调查样本中女生人数是男生人数的1.男生追星人数占男生人数的J,女生追星的人数占女生人数的若有95%的把握认为是,6J否追星和性别有关,则调查样本中男生至少有人.参考数据及公式如下:K2n(ad-bc)23 + b)(c+d)a + c)(b+d)14. (2023全国模拟预测)某校为了解本校学生课间进行体育活动的情况,随机抽取了60名男生和60名女生,通过调查得到以下数据:60名女生中有10人课间经常进行体育活动,60名男生中有20人课间经常进行体育活动.(1)请补全2x2列联表(单位:人),并根据小概率值a=0.05的独立性检验,判断学生课间经常进行体育活动是否与性别有关联;性别课间进行体育活动情况合计不经常绐常男女合计(2)以样本的频率作为概率的值,在全校的学生中任取4人,记其中课间经常进行体育活动的人数为X,求X的分布列与数学期望.Mad - bc)( + b)(c + d)(q + c)(Z> + d),其中 = + b + c + d.附:Z215. (2023上全国高三专题练习)某市某部门为了了解全市中学生的视力情况,采用比例分配的分层随机抽样方法抽取了该市120名中学生,已知该市中学生男女人数比例为7:5,他们的视力情况统计结果如表所示:性别视力情况合计近视不近视男生30女生40合计120(1)请把表格补充完整,并根据小概率值a=0.01的独立性检验,判断近视是否与性别有关;(2)如果用这120名中学生中男生和女生近视的频率分别代替该市中学生中男生和女生近视的概率,且每名同学是否近视相互独立.现从该市中学生中任选4人,设随机变量X表示4人中近视的人数,求X的分布列及均值.,w.2n(ad-bc+p.l,附:Z=7»>其中=+b+c+”(a+b)(c+d)(a+c)b+d)16. (2023全国统考高考真题)一项试验旨在研究臭氧效应.实验方案如下:选40只小白鼠,随机地将其中20只分配到实验组,另外20只分配到对照组,实验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).(1)设X表示指定的两只小白鼠中分配到对照组的只数,求X的分布列和数学期望;(2)实验结果如下:对照组的小白鼠体重的增加量从小到大排序为:实验组的小白鼠体重的增加量从小到大排序为:(i)求40只小鼠体重的增加量的中位数加,再分别统计两样本中小于与不小于的数据的个数,完成如下列联表:FZR对照组实验组t(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.附: