11-5变量间的相关关系、统计案例-2024.docx
《11-5变量间的相关关系、统计案例-2024.docx》由会员分享,可在线阅读,更多相关《11-5变量间的相关关系、统计案例-2024.docx(26页珍藏版)》请在课桌文档上搜索。
1、11.5变量间的相关关系、统计案例基础篇考点一变量间的相关关系1.(2023届广东东莞四中月考,5)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是相关系数为0相关系数为5 1015 20 25 3035 相关系数为GO 5b505050A.r2r4Or3r1 C.4r2O3r1 答案AO5101520253035相关系数为小B.r2r4Or1r3D.420ri5,则当无每增大一个单位时,J增大1.1个单位C.设两个变量x,y之间的线性相关系数为八则IrI=I的充要条件是成对数据构成的点都在经验回归直线上D.在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果
2、越好答案CD3. (2020课标I,文5,理5,5分)某校一个课外学习小组为研究某作物种子的发芽率y和温度M单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(即,y)G=I,2,.,20)得到下面的散点图:榔80%低60%20%0贝40%1()2()3()40温度汽:由此散点图,在Ioe至40C之间,下面四个回归方程类型中最适宜作为发芽率),和温度X的回归方程类型的是B.y=a+bxlD.y=a+bn xA,.y=a+bxC.y=a+be答案D4. (2017山东理,5,5分)为了研究某班学生的脚长M单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测
3、量数据的散点图可以看出y与X之间有线性相1010关关系,设其回归直线方程为y=bx+.已知=i为=225Ni=Iy,=600,6=4.该班某学生的脚长为24,据此估计其身高为答案C5. (多选)(2022山东济宁一中开学考试,10)给出以下四个说法,其中正确的说法是()A.如果由一组样本数据C,y),G2),,)得到经验回归方程)=晨+2,那么经验回归直线至少经过点(x,y),但,2),,(M中的一个B.在回归分析中,用决定系数N来比较两个模型拟合效果,必越大,表示残差平方和越小,即模型的拟合效果越好C在经验回归方程,=-0.5x+0.7中,当解释变量X每增加一个单位时,响应变量,平均增加0.
4、5个单位D.若变量y和X之间的相关系数为l0.9872,则变量),和X之间的负线性相关很强答案BD6.(2022全国乙,理19,文19,12分)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:?),得到如下数据:样本号iI2345678910总和根部横截面积M0.040.060.040.080.080.050.050.070.070.060.6材积量H0.250.400.220.540.510.340.360.460.420.403.9101010并计算得i=xf=0.038,i=
5、1K=1.6158,l=1孙=0.2474.估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);t= (j-)(yj-y)yt= (Xt-X)2 t= (y-y)2现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m?.己知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数I一等刃yi=(Xt-X)2=(y(-y)2L8961.377.解析(1)估计该林区这种树木平均一棵的根部横截面积为土=工=0.06(m平均一棵的材积量为歹=
6、治0.39(m)IOEi=I (XL 幻 Sl 文)IOI 10IOi= (.i-)2 (y-y)2(2)样本相关系数-幻,一/=TJi=(X1-X)2i(yi-y)210i=勺-10行(1xf-10x2)(yf-10y2)0.2474-10x0.06x0.39(0.038-100.062)(1.6158-100.392)0.013 40.01340.0134CCrJ-0.97.0.0020.09480.01L8960.01377即该林区这种树木的根部横截面积与材积量的样本相关系数约为0.97.设这种树木的根部横截总面积为X11总材积量为Km3,则=则Y=等=186X,39zzl2090.06
7、所以该林区这种树木的总材积量的估计值为1209n?.7.(2020课标II,文18,理18,12分)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(H,y)(i=l,2,20),其中H和y分别表示第i个样区的植物覆盖面积(单位:公顷)和202020这种野生动物的数量,并计算得=1为=60E=Iyi=200Ni=I(疗2020X)2=80,三1(yi-y)2=9OooNi=I(Xm)(M9)=800.(1)求该地区这种野生动物数量的估计值(这种野生
8、动物数量的估计值等于样区这种野生动物数量的平均数乘地块数);求样本(xl,M)G=1,2,.20)的相关系数(精确到0.01);根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数Kl翼(XLWE,L414.Ji=(Xi-X)2i=1(yi-y)220解析(1)由已知得样本平均数歹=/i=y=60,从而该地区这种野生动物数量的估计值为60x200=12000.样本U,y)(仁1,2,20)的相关系数2020i=1QL幻(九一歹)_ri=(XL君(一歹)_800_2094I2020I
9、2020809OOO3-,Ji=(ATi-X)2Zj=I(yi-y)2JEi=I(l-)2l=(yi-y)2(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.理由如下:由知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.考点二独立性检验1.(2021全国甲,文17,理17,12分)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台
10、机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:I一级品I二级品I合计甲机床15050200乙机床12080200合计270130400(D甲机床、乙机床生产的产品中一级品的频率分别是多少?能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附.Kl=MQd-bc)2(Q+b)(c+d)(+c)(b+d)P (K2次)0.050 0.010 0.0013.8416.63510.828解析(1)因为甲机床生产的200件产品中有150件一级品,所以甲机床生产的产品中一级品的频率为黑=因为乙机床生产的200件产品中有120件一级品,所以乙机床2004生产的产
11、品中一级品的频率为黑=I根据2x2列联表中的数据,得K三丝芸):“山、(+b)(c+d)(+c)(b+d)=誓等竟著=嘿10256,因为12566635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.2.(2022全国甲文,17,12分)甲、乙两城之间的长途客车均由A和8两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附R=M
12、ad一八产叩(Q+b)(c+d)(+c)(b+d)P(K2X)0.1000.050 0.0102.7063.8416.635解析(1)由题意可得A公司长途客车准点的概率P尸兽=三,B公司长途客车准点的ZoO13概率P=%=Z2408(2)因为/2=500X(240X30-20X210)22.706,45050240260所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.3.(2020新高考I,19,12分)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM”和SO?浓度(单位:UgZm)得下表:so2PM0,50(50,15
13、0(150,4750,3532184(35,756812(75,13710(1)估计事件“该市一天空气中PM”浓度不超过75,且S02浓度不超过150”的概率;根据中的列联表,判断是否有99%的把握认为该市一天空气中PM25浓度与SO2浓度有关.附.心=(d-bc)2H(Q+b)(c+d)(+c)(b+d)P(K1lc)0.0500.0100.001k3.8416.63510.828解析(1)根据抽查数据,该市100天的空气中PM25浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM”浓度不超过75,且SCh浓度不超过150的概率的估计值为益=0
14、.64.根据抽查数据,可得22列联表:SO2PM250,150(150,4750,756416(75,1151010根据(2)的列联表得6.635,故有99%的把握认为该市一天空气中PM”浓度与SCh浓度有关.4. (2023届长沙一中月考二,20)某芯片制造企业使用新技术对某款芯片进行试生产.在试产初期,该款芯片生产有四道工序,前三道工序的生产互不影响,第四道是检测评估工序,包括智能自动检测与人工抽检.在试产初期,该款芯片的批次“生产前三道工序的次品率分别为P,P2,P3=605958求批次M芯片的次品率Pw第四道工序中智能自动检测为次品的芯片会被自动淘汰,合格的芯片进入流水线并由工人进行抽
15、查检验.已知批次M的芯片智能自动检测显示合格率为98%,求工人在流水线进行人工抽检时,抽检一个芯片恰为合格品的概率.该企业改进生产工艺后生产了批次N的芯片.某手机生产厂商获得批次M与批次N的芯片,并在某款新型手机上使用.现对使用这款手机的用户回访,对开机速度进行满意度调查.据统计,回访的100名用户中,安装批次M的有40人,其中对开机速度满意的有30人;安装批次N的有60人,其中对开机速度满意的有58人.依据=0.005的独立性检验,能否认为芯片批次与用户对开机速度满意度有关?n(ad-bc)2(Q+b)(c+d)(Q+c)(b+d)a0.10().05().0100.0050.(X)lXa2
16、.7063.8416.6357.87910.828解析(1)批次用芯片的次品率为Pjw=I-(I-Pi)(I-P2)(I-P3)=1-=OU595oNU设批次M的芯片智能自动检测合格为事件A,人工抽检合格为事件8,由已知得P(八)=券,P(48)=1Pm=弓=焉则工人在流水线进行人工抽检时,抽检一个芯片恰为合格品为事件8A,P(BH)=需=19x100=95209898,(2)零假设为Ho:芯片批次与用户对开机速度满意度无关.由数据可建立22列联表如下:(单位:人)开机速度满意度芯片批次MN合计不满意10212满意305888合计4060100根据列联表得2=11(dfc)2=100(10x5
17、8-230)(+b)(c+d)(+c)(b+d)-40601288因此,依据=0.005的独立性检验,我们推断HO不成立,即能认为芯片批次与用户对开机速度满意度有关.此推断犯错误的概率不大于0.005.5. (2020课标I11,18,12分)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次量等级L0,200(200,400(400,6001(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一
18、组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2X2列联表,并根据列联表,判断是否有95就l把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.人次400人次400空气质量好空气质量不好附R=n(ad-bc)2(+b)(c+d)(+c)(b+dyP(K2A)k0.0500.0100.0013.8416.63510.828解析(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如表:空气质量等级1234概率的估计值0.430.270.210.
19、09一天中到该公园锻炼的平均人次的估计值为磊X(IooX20+300x35+500x45)=350.根据所给数据,可得2x2列联表:人次400人次400空气质量好3337空气质量不好228根据列联表得ioo(338-2237)5.82O.由于5.8203.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.6. (2023届河北邯郸摸底,19)暑假期间,某学校建议学生保持晨读的习惯,开学后,该校对高二、高三随机抽取200名学生(该学校学生总数较多),调查日均晨读时间,数据如表:日均晨读时间/分钟0,10)10,20)20,30)30,40)40,50)50,60人数5
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 11 变量 相关 关系 统计 案例 2024
链接地址:https://www.desk33.com/p-962861.html