欢迎来到课桌文档! | 帮助中心 课桌文档-建筑工程资料库
课桌文档
全部分类
  • 党建之窗>
  • 感悟体会>
  • 百家争鸣>
  • 教育整顿>
  • 文笔提升>
  • 热门分类>
  • 计划总结>
  • 致辞演讲>
  • 在线阅读>
  • ImageVerifierCode 换一换
    首页 课桌文档 > 资源分类 > DOCX文档下载  

    专题09成对数据的统计相关性、一元线性回归模型及其应用 (3个知识点5个拓展1个突破5种题型3个易错点)解析版.docx

    • 资源ID:1145423       资源大小:457.16KB        全文页数:42页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    专题09成对数据的统计相关性、一元线性回归模型及其应用 (3个知识点5个拓展1个突破5种题型3个易错点)解析版.docx

    专题09成对数据的统计相关性、一元线性回归模型及其应用(3个知识点5个拓展1个突破5种题型3个易错点)【目录】倍速学习四种方法【方法一】脉络梳理法知识点I.相关关系知识点2.样本相关系数知识点3.经验回归方程拓展1.判断变量相关关系的三种方法拓展2.回归系数b的含义拓展3.最小二乘法求回归方程及回归方程的逆用拓展4.经验回归分析“三步曲”拓展5.样本相关系数、决定系数K2的应用突破:非线性相关问题【方法二】实例探索法题型1.变量间相关关系的判断题型2.样本相关系数的应用题型3.经验回归方程及其应用题型4.回归效果的刻画题型5.非线性回归分析【方法三】差异对比法易错点L混淆相关关系与函数关系致误易错点2.对经验回归方程的理解不到位致误易错点3.线性相关系数理解不正确致误【方法四】成果评定法【知识导图】一一知识点L相关关系/一知识点2.样本相关系数/知识点3.经验回归方程/拓展L判断变量相关关系的三种方法r成对数据的统计相关性一拓展2.回归系数力的含义V'''一拓展3.最小乘法求回归方程及回归方程的逆用'J拓展4.经验回归分析“三步曲”、-拓展5.样本相关系数,、决定系数改的应用突破:非线性相关问题【倍速学习四种方法】【方法一】脉络梳理法知识点I.相关关系-相关关系1 .相关关系的定义:两个变量有关系,但没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相关关系.2 .相关关系的分类(1)按变量间的增减性分为正相关和负相关.正相关:当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势;负相关:当一个变量的值增加时;另一个变量的相应值呈现减少的趋势.(2)按变量间是否有线性特征分为线性相关和非线性相关(曲线相关).线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在二附近,我们称这两个变量线性相关;非线性相关或曲线相关:如果两个变量具有相关性,但不是线性相关,我们称这两个变量非线性相关或曲线相关.二、相关关系的直观表示散点图:为了直观描述成对样本数据的变化特征,把每对成对样本数据都用直角坐标系中的点表示出来,由这些点组成的统计图,叫做散点图.例1.(1)单选题(2023下河南省直辖县级单位高二校考期末)下列两个变量中能够具有相关关系的是()A.人所站的高度与视野B.人眼的近视程度与身高C.正方体的体积与棱长D.某同学的学籍号与考试成绩【答案】A【分析】利用相关关系的定义判断.【详解】A.人所站的高度越高则视野越开阔,具有正相关关系,故正确;B.人眼的近视程度与身高不具有相关关系,故错误;C.正方体的体积与棱长是一种确定关系,故错误;D.某同学的学籍号与考试成绩不具有相关关系,故错误;故选:A(2)单选题(2022上新疆和田高二校考期末)对于变量工,丁有以下四个散点图,由这四个散点图可以判断变量X与3成负相关的是()【分析】根据各图中点的分布,分析变量的相关关系即可.【详解】A:各点分布没有明显相关性,不符;B:各点分布在一条直线附近,且有负相关性,符合;C:各点分布在一条抛物线附近,变量之间先呈正相关,后呈负相关,不符;D:各点分布在一条直线附近,且有正相关性,不符.故选:B知识点2.样本相关系数(1)Ylxiyi-nxy/=1(-)(-y) /=122yi -ny(2)样本相关系数厂的数字特征:当r>0时,称成对样本数据正相关;当<0时,称成对样本数据负相关;当卜I越接近1时,成对样本数据的线性相关程度越强;当M越接近0时,成对样本数据的线性相关程度越弱.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多,需要注意的是线性相关系数,的绝对值小,只是说明线性相关程度低,但不一定不相关,可能是非线性相关.利用相关系数,来检验线性相关显著性水平时,通常与0.75作比较,若帆X).75,则线性相关较为显著,否则不显著.例2.(2024上天津高三校联考期末)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国的高潮.某老师很喜欢“学习强国中"挑战答题"模块,他记录了自己连续七天每天一次最多答对的题数如下表:参考数据:x = 4, y = 19, xf = 140, Xyf2 = 2695, Zxa=600, 62.45, r=l1=11=1天数X1234567一次最多答对题数),12151618212427由表中数据可知该老师每天一次最多答对题数),与天数X之间是相关(填“正"或"负"),其相关系数r(结果保留两位小数)【答案】正0.99【分析】根据正相关和负相关的定义即可得出结论;根据相关系数公式求相关系数即可.【详解】由表中数据得)'随X的增大而增大,所以该老师每天一次最多答对题数y与天数X之间是正相关,0.99.600-7×4×19168117140-7×42X2695-7×19227X24272.45故答案为:正;0.99.知识点3.经验回归方程1 .一元线性回归模型Y=bx+e,称八、,为丫关于X的一元线性回归模型.其中y称为因变量或响应变量,4称为自变量或解释变量,且称为截距参数,女称为斜率参数;e是y与"+之间的随机误差,如果6=0,那么Y与X之间的关系就可以用一元线性函数模型来描述.2 .经验回归方程?=Ar+a:(1)相关概念:经验回归直线:经脸回归方程也称经脸回归函数或经验回归公式,图形称为经脸回归直线.最小二乘估计:求经验回归方程的方法叫做最小二乘法,求得的b,叫做瓦。的最小二乘估计.残差:对于响应变量丫,通过观测得到的数据称为观测值,通过经验回归方程得到的y称为预测值,观测值减去预测值称为残差.Za-可(K-7)Yxiyi-nxyb=-=(2)SaY)232_苏rl1a=y-bx(3)决定系数代:R2=-i()2ilW越大,表示残差平方和越小,即模型的拟合效果越好;W越小,表示残差平方和越大,印模型的拟合效果越差;方法技巧经验回归方程的求法及应用在散点图中,样本点大致分布在一条直线附近,利用公式求出6花可写出经验回旧方程,利用经验回归模型进行研究,可近似地利用经验回归方程a=Ar+来预测。方法技巧一元线性回归模型拟合问题的求解策略在一元线性回归模型中,R2与相关系数r都能刻画模型拟合数据的效果.r越大,R2就越大,用模型拟合数据的效果就越好.例3.(2024上青海西宁高三统考期末)家居消费是指居民在日常生活中购买和使用的家具、家电、建材、装修等产品和服务所形成的消费行为.长期以来,家居消费一直是居民消费的重要组成部分,对于带动居民消费增长和经济恢复具有重要意义.某家居店为了迎接周年庆举办促销活动,统计了半个月以来天数X与销售额),(万元)的一组数据(x,y):(3,61),(6,82),(9,91),(12,104),(15,112).通过分析发现X与y呈线性相关.求X与y的样本相关系数(结果保留三位小数);求X与),的线性回归方程¥=»1+%(,b的结果用分数表示).xiyi-nyR,屋“玩.如 一位215860126.xiyi-rix-y参考公式:相关系数r=“>=Fb=PJX一行2.店乂2_行2参考数据:为#=495,2=42086,丈Xa=4422,i=l【答案】0.984;(2)y=%+丝155【分析】(1)根据给定数据,求出样本中心点,再代入公式计算即得.(2)由(1)的信息,结合最小二乘法公式计算即得.【详解】(1)依题意,U + 6 + 9 + 12 + 15q-=61+82 + 91 + 104+112=90>辱E唇f4422-5×9×90495 - 5 × 92 × 42086 - 5 × 9O2也,0.9843 Jl 5860 126z、,.£“比-5-了4422-5×9×9037262lM62C264因型23=495-5行FIr则"9。-丁9=亍,/=I所以),关于X的线性回归方程为y=+平.拓展1.判断变量相关关系的三种方法1.解答题.(2023上高二课时练习)国家学生体质健康标准(2014年修订)中,体能监测包含身高、体重、肺活量、50米跑、坐位体前屈、引体向上(女:仰卧起坐)、立定跳远、IoOO米跑(女:800米跑),据此得到的每项指标都可以按照相应的单项指标评分表进行测量和计分,分别得到相应的数据.这些数据中的任意两组是否都可以作为成对数据进行相关分析?依据你的经验,哪两组数据的相关程度可能最高?哪两组数据的相关程度可能最低?如何通过统计方法检验你的判断?【答案】(1)都可以肺活量和50米跑相关程度最高,身高和肺活量相关程度最低(答案不唯一)【分析】(1)根据相关关系的定义判断即可;(2)根据经验找到合理的案例,结合统计学知识分析即可.【详解】(1)都可以,因为每项指标都可以按照相应的单项指标评分表进行测量和计分,且任意两项指标之间存在一定的关系,但又没有确切到可由其中的一个精确地决定另一个的程度,所以任意两组数据均可以作为成对数据进行相关分析,只是有些数据相关性较弱.(2)依据经验可知肺活量和50米跑相关程度最高,身高和肺活量相关程度最低,(答案不唯一),通过测量出50米成绩与肺活量的数据,作出散点图,即可判断.通过测量出身高与肺活量的数据,作出散点图,即可判断.拓展2.回归系数人的含义2.单选题(2023上天津武清高三天津英华国际学校校考阶段练习)有人调查了某高校14名男大学生的身高及其父亲的身高,得到如下数据表:编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182170175180父亲身高1-165-TTl T !I-r 5 0 5 0 58 8 7 7 6Ii 11 H 1 H利用最小二乘法计算的儿子身高Y关于父亲身高X的回归直线为>0.839x+28.957.根据以上信息进行的如下推断中,正确的是()A.当x=172时,ymf若一位父亲身高为172cm,则他儿子长大成人后的身高一定是173CmB.父亲身高和儿子身高是正相关,因此身高更高的父亲,其儿子的身富也更高C.从回归直线中,无法判断父亲身高和儿子身高是正相关还是负相关D.回归直线的斜率可以解释为父亲身高每增加ICm,其儿子身高平均增加0.839Cm【答案】D【分析】由回归直线中的亍为估计值并不绝对,可排除A、B,O.839>O可排除C.【详解】对A选项:173为估计值,并不一定,故错误;对B选项:同上,该值为估计值,并不绝对,故错误;对C选项:由0.839>0,故可判断父亲身高和儿子身高是正相关,故错误;都D选项:回归宜线的斜率可以解释为父亲身高每增加ICm,其儿子身高平均增加0.839cm,故正确.故选:D.拓展3.最小二乘法求回归方程及回归方程的逆用3. (2024全国高三专题练习)近年来,我国新能源汽车技术水平不断进步、产品性能明显提升,产销规模连续六年位居世界首位.某汽车城从某天开始连续的营业天数工与新能源汽车销售总量y(单位:辆)的统计数据如下表所示:从某天开始连续的营业天数X1020304050新能源汽车销售总量),/辆6268758189(1)已知可用线性回归模型拟合y与X的关系,请用相关系数加以说明(结果精确到0.001);求y关于X的经验回归方程y = hx + af并预测该汽车城连续营业130天的汽车销售总量.参考数据:¾= H920, 2 =28575, 52.236.iyi-riy参考公式:相关系数厂,经验回归方程= A +Ar中斜率与截距的最小二乘估计公 '2-wj2 1=1Yxiyi-rixy式分别为6 =母,a = y-bx.打”应2【答案】(1)答案见解析(2)y = 0.67x + 54.9, 142 辆.【分析】(1)根据相关系数的计算公式代入数据即可求解,(2)由最小二乘法的计算公式求解线性回归方程,即可代入求解.【详解】(1) (1) I10 + 20+30 + 40 + 50 ”=30 ,62 + 68 + 75 + 81 + 89= 75,5回=5x30x75=11250,x22=IO2÷202+302+402+502=5500,则相关系数11920-11250670_572 代)"5F '5500-5×302 ×28575-5×752 71000 ×450 0.999y与X的相关系数近似为0.999,说明y与A-的线性相关程度相当高,从而可用线性回归模型拟合y与X的关系.5a ZXa - 5取(2) (2)由(1)得A = V67012-5x210000.67,G=I-宸=75-0.67x30=54.9,所以y关于X的经验回归方程为£=067x÷54.9.%=130RAy=0.67x+54.9,得夕=0.67×130+54.9=142,所以预测该汽车城连续营业130天的汽车销售总量为142辆.拓展4.经验回归分析“三步曲”4. (2021下广东河源高二河源市河源中学校考开学考试)现有一环保型企业,为了节约成本拟进行生产改造,现将某种产品产量X与单位成本y统计数据如表:月份123456产量(千件)234345单位成本(元/件)737271736968试确定回归方程§,=加+机指出产量每增加100O件时,单位成本平均下降多少?假定单位成本为70元/件时,产量应为多少件?(参考公式:务=上(-)2-w?(参考数据>=148l,Zx;=79)【答案】y=T.818x+77.363(2)1.818元(3)4050件【分析】(1)根据所给数据画出散点图,根据公式算出相应的Aa即可得解.(2)直接代入预测模型预测即可.(3)直接代入预测模型解方程即可.【详解】(1)设X表示每月产量(单位:千件),y表示单位成本(单位:元/件),作散点图如图.由图知y与X间呈线性相关关系.设线性回归方程为¥=屏+)2+3÷4+3+4+5= 3.5,73 + 72 + 71+73 + 69 + 68= 71,C1481OXjQX"1oloCz由公式可求得b=79-6x(35)2之一'18,a=y71-(-1.818)×3.5=77363,,回归方程为y=-1.818x+77.363.(2)由回归方程知,每增加100o件产量,单位成本下降1.818元.(3)当y=70时,70=-1.818x+77.363,得x4.050千件.,单位成本是70元/件时,产量约为4050件.拓展5.样本相关系数、决定系数火?的应用5. 填空题(2021下安徽六安高二安徽省舒城中学校考阶段练习)甲、乙、丙、丁4位同学各自对A,B两变量进行回归分析,分别得到散点图与残差平方和支(y一抄)2如下表:l=i甲乙丙T散点图BTBBOAOAOAOA残差平方和115106124103则试验结果体现拟合A,B两变量关系的模型拟合精度高的同学是.【答案】丁【分析】根据散点图中各样本点条状分布越均匀,同时残差平方和越小,即可判断其线性回归模型的拟合效果越好.【详解】对于已经获取的样本数据,心表达式中H(K一凹)为确定的数,则残差平方和越小,2越大,由此知丁同学的线性回归模型的拟合效果最好,故答案为:丁.6. (2021下黑龙江哈尔滨高二哈九中校考期末)全球化时代,中国企业靠什么在激烈的竞争中成为世界一流企业呢?由人民日报社指导,中国经济周刊主办的第十八届中国经济论坛在人民日报社举行,就中国企业如何提升全球行业竞争力进行了研讨.数据显示,某企业近年加大了科技研发资金的投入,其科技投入X(百万元)与收益(百万元)的数据统计如下:科技投入X1234567收益y19202231405070根据数据特点,甲认为样本点分布在指数型曲线y=2加。的周围,据此他对数据进行了一些初步处理.如下表:Z7-v*1ZXiyi1=17SXR/=I(y,-y)2/=I(-vl-y.)2Z=I5140123914921341307其中Zj=IOg2%,z=Yzi./J=I(I)请根据表中数据,建立y关于X的回归方程(系数5精确到0.1,用5的近似值算6);(2)乙认为样本点分布在直线y=比+的周围,并计算得回归方程为9=8.25x+3,以及该回归模型的决定系数(即相关指数)=0.893,试计算,比较甲乙两人所建立的模型,谁的拟合效果更好?(精确到0.001)由所得的结论,计算该企业欲使收益达到1亿元,科技投入的费用至少要多少百万元?(精确到0.1)附:对于一组数据3,匕),(w2,v2),.,(mh,vm),其回归直线方程6=肉+&的斜率和截距的最小二乘法估(wf-w)(v1.-v)£%匕-而(½-vJ2计分别为液二T,a=v-u,决定系数:2=l-j.参考数据:(w-w)2IX-应2(v-v)2;=!/=!三!Iog252.3.【答案】(1)y=23t+38;(2)蹄0939;甲建立的回归模型拟合效果更好;科技投入的费用至少要9.3百万元.【分析】两边取对数得log?=瓜+明令Z=IOg利用最小二乘法可求得2=O.3x+3.8,由此可得回归方程;根据公式计算可得相关指数Ri三由203Z3oo,解不等式可求得大【详解】将y=2zw+"两边取对数得:Vx=4,0根据最小二乘估计可知:/s0.939>=0.893,由此可得结论;范围,由此可得结果.Iog2y=bx+a,令Z=IOg则2=r+G,-7149,7x5x4G2r_2140-7×42a=z-=5-0.3×4=3.8,回归方程为z=0.3X+3.8,即P=20'3t+38.1a。甲建立的回归模型的q=1一晨P.939其=0.893.甲建立的回归模型拟合效果更好.由知,甲建立的回归模型拟合效果更好.设2M+3si00,解得:0.3x+3.8log2100=2+21og25,解得:9.3.科技投入的费用至少要9.3百万元,下一年的收益才能达到1亿.突破:非线性相关问题1) (2023全国模拟预测)一座城市的夜间经济不仅有助于拉动本地居民内需,还能延长外地游客、商务办公者等的留存时间,带动当地经济发展,是衡量一座城市生活质量、消费水平、投资环境及文化发展活力的重要指标.数据显示,近年来中国各地政府对夜间经济的扶持力度加大,夜间经济的市场发展规模保持稳定增长,下表为20172022年中国夜间经济的市场发展规模(单位:万亿元),其中20172022年对应的年份代码依次为1-6.年份代码X123456中国夜间经济的市场发展规模y/万亿元20.522.926.430.936.442.4已知可用函数模型y="拟合丁与X的关系,请建立了关于X的回归方程(d。的值精确到0.01);某传媒公司预测2023年中国夜间经济的市场规模将达到48.1万亿元,现用(1)中求得的回归方程预测2023年中国夜间经济的市场规模,若两个预测规模误差不超过1万亿元,则认为(1)中求得的回归方程是理想的,否则是不理想的,判断(1)中求得的回归方程是否理想.参考数据:VI=I2.848ea,481.1673.36673.28217.251.162.83其中匕=1%.参考公式:对于一组数据(%h),(%,匕),(”,匕),其回归直线。=&+£的斜率和截距的最小二乘估计分(w,-w)(v,.-v)别为=j三H,a=v-u,(w-w)2i=l【答案】(1)9=17.25x1.16,;是理想的【分析】(I)通过对所给的的函数模型取对数,转换为求回归直线方程即可,再结合题中所给的直线方程与数据即可得解.(2)利用(1)中求得的函数模型进行预测,结合回归方程理想的定义判断即可.【详解】(1)将y="的等号左右两边同时取自然对数得lny=ln(")=ln+Nnb,所以 v = lniz÷xln>.x=1÷2÷3÷4÷5÷6=3.5,66r2 = 2 + 22+32 +42 +52+62 =91 , I=I66-可(匕-叼 V-6xv所以6=JTSa-H)2-j2-6x2i=1i=l73.282-6×3.5×3.36691-6×3.522.59617.5«0.148,na3.366-0.148×3.5=2.848.所以二=2.848+0.148x,即ln5,=2848+()148x,所以旷=62&8+°期=17.25、1.16'.2) )2023年对应的年份代码为7,当=7时,y=17.25×1.167=17.25×2.8348.82,48.82-48.1=0.72<1,所以(1)中求得的回归方程y=17.25xL16'是理想的.【方法二】实例探索法题型1.变量间相关关系的判断1.多选题(2023下高二课时练习)下列说法正确的是()A.闯红灯与交通事故发生率的关系是相关关系B.同一物体的加速度与作用力是函数关系C.产品的成本与产量之间的关系是函数关系D.广告费用与销售量之间的关系是相关关系【答案】ABD【分析】利用相关关系的定义判断.【详解】闯红灯与发生交通事故之间不是因果关系,但具有相关性,是相关关系,所以A正确;物体的加速度与作用力的关系是函数关系,B正确;产品的成本与产量之间是相关关系,C错误;广告费用与销售量之间是相关关系,D正确.故选:ABD题型2.样本相关系数的应用2.多选题(2023上辽宁沈阳高二校考期末)对两个变量和X进行回归分析,则下列结论正确的为OA.回归直线至少会经过其中一个样本点(Xj,%)B.残差平方和越小的模型,拟合的效果越好C.建立两个回归模型,模型1的相关系数4=T)999,模型2的相关系数弓=0876,则模型2的拟合度更好D.以y=e尿模型去拟合某组数据时,为了求出回归方程,设Z=In),将其变换后得到线性方程z=6x+ln2,则力的值分别为2,6【答案】BD【分析】根据回归方程、残差、相关系数、非线性回归等知识对选项进行分析,从而确定正确答案.【详解】A选项,回归直线不一定经过样本点,A选项错误.B选项,残差平方和越小的模型,拟合的效果越好,B选项正确.C选项,1用所以模型1的拟合度更好,C选项错误.D选项,由z=6x+ln2=lny,得丁=©6"加2=e6.*2=2e6=2力=6,D选项正确.故选:BD题型3.经验回归方程及其应用3.单选题(2023上四川成都高三成都七中校考期中)某公司一种型号的产品近期销售情况如表:月份X23456销售额y(万元)15.116.317.017.218.4根据上表可得到回归直线方程2=O.75x+,据此估计,该公司7月份这种型号产品的销售额为()A.18.85万元B.19.3万元C.19.25万元D.19.05万元【答案】D【分析】根据题意,由回归直线方程过样本点的中心,即可求得然后代入计算,即可得到结果.【详解】由表中数据可得X=W(2+3+4+5+6)=4,J=-(15.1+16.3+17÷17.2÷18.4)=16.8,因为回归直线过样本点的中心,所以168=0.754+,解得=13.8,所以回归直线方程为R=0.75x+l3.8,则该公司7月份这种型号产品的销售额为y=O75x7+13.8=19.O5万元.故选:D题型4.回归效果的刻画4 .单选题(2023江苏苏州校联考模拟预测)为研究某地区疫情结束后一段时间内的复工率,用模型(1)和模型(2)模拟复工率了(%)与复工时间X(X的取值为5,10,15,20,25,30天)的回归关系:模型(1)yy=a+bx,模型(2)y="+-,设两模型的决定系数依次为解和局.若两模型的残差图分别如下,则(模型(1)的残差图模型的残差图62IO 15 20 25 3010 15 20 25 30A. R<R;R;=MB.残差0 %D.R;、后关系不能确定【答案】A【分析】根据残差点图分析拟合效果,从而得到答案.【详解】根据残差点图,模型(2)残差点比较均匀地落在水平的带状区域中,带状区域宽度窄,拟合精度较高,所以吊后,故选:A.题型5.非线性回归分析5 .(2023全国高二课堂例题)在实验室中,获得了某化学品的化学反应时间和转化率的数据,见表4-1,试建立转化率),关于反应时间X的回归方程.时间x/min6080100120140150160170转化率y%6.139.9915.0220.9231.1138.8547.2555.05【答案】y=1.986e00,9x【分析】先作出表4-1数据的散点图,从散点图可以看出变量y与彳之间的关系可以近似的用指数曲线y=c卢”来表示,设Z=Iny,然后用求回归直线的办法进行求解.【详解】根据收集的数据作散点图(图4.2-4).,转化率/%6050.403020.IO.O2()406080I(X)120140160180时间min图4.2-4观察散点图可知,样本点并没有分布在某条直线附近,因而变量),与X之间没有明显的线性相关关系,所以不能直接利用线性回归模型来刻画这两个变量之间的关系.根据已有的数学知识,可以认为样本点分布在指数曲线),=午2的附近,其中。和J是待定参数.为估计参数。和在丁二。卢”的两端取对数,得到Iny=Inq+qr.再令Z=Iny,«=Inc1,b=c2f则得到直线方程z=6x+.将表4-1中的数据进行代换,得到的数据见表4-2.表4-2X6080100120140150160170z(=l")1.8132.3022.7093.0413.4383.6603.8554.008图4.2-5是根据表4-2中数据作出的散点图.32- 1O50100150200图4.25从图425中可以看出,变换后的样本点分布在一条直线的附近,说明Z和K之间具有线性相关关系,因此可以用线性回归方程来拟合.对表4-2中的数据,用最小二乘法可得线性回归方程为2=0.019x+0.686再利用y=e'可得到转化率y关于反应时间X的非线性回归方程为J,=e三.e009xssl986eOOI9x【方法三】差异对比法易错点1.混淆相关关系与函数关系致误1. (2023下宁夏固原高二校考阶段练习)下图中的两个变量,具有相关关系的是()【分析】根据相关关系的概念逐项分析判断.【详解】相关关系是种非确定性关系.对于A、C:两个变量具有函数关系,是一种确定性关系,故A、C错误;对于D:图中的散点分布没有什么规律,故两个变量之间不具有相关关系,故D错误;对于B:图中的散点分布在从左下角区域到右上角区域,两个变量具有相关关系,故B正确;故选:B.易错点2.对经验回归方程的理解不到位致误2. (2023上辽宁丹东高三统考期中)哈尔滨冰雪大世界于2022年9月投入使用,总投资高达25亿元,号称“永不落幕"的冰雪游乐场,从“一季繁荣到“四季绽放"2023年1月至5月的游客数以及对游客填写满意与否的调查表,统计如下:月份X12345游客人数y(万人)130rnn9080满意率0.50.40.40.30.35已知)'关于X的线性回归直线方程为y=-lL5x+134.5.(1)求2月份,3月份的游客数犯的值;在1月至5月的游客中随机抽取2人进行调查,把满意率视为概率,求评价为满意的人数X的分布列与期望E(X).Za-可(凹-y)iyi-ny(参考公式:B=J=j,a=y-bxt(%-T)2-应2r三I/«1【答案】机二105,=954分布列见解析;-【分析】(1)根据题意中调查表及回归直线方程,可以分别求出帆,的值;(2)根据题意得满意率为概率,即可列出分布列,求解出期望.【详解】(1)由题意可得元=3J=丝理出,且7=TL5x3+1345=100,所以得:m+M=200,5又因为:ZXa=2加+3+890,5xy=1500,59=45,/=I所以得:j=2:36O=TL5,化简得:2m+3"=495,5545联立得:机=105,=95.(2)任取1个人满意的概率P =130×0.5+105×0.4+95×0.4+90×0.3+80×0.35500所以满意的人数X服从二项分布,即XB(2,|随机变量X的取值分别为:0,1,2,从而得:P(X=O)=q1(j总P(X=I)=41J(I)1225P(X=2) = G425所以可得满意人数X的分布列如下表所示:X012P9124252525Q1244所以期望E(X)=OX卷+Ix六+2X文=不易错点3.线性相关系数理解不正确致误3. (2022上四川遂宁高二校联考期末)某地随着经济发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款,如表1年份X20162017201820192020储蓄存款y(千亿元)567810为了研究计算的方便,工作人员将上表的数据进行了处理,f=2015,z=y-5得到表2:时间代号,12345Z01235求Z关于,的线性回归方程:通过(1)中的方程,求出y关于X的回归方程:用所求回归方程预测到2021年年底,该地储蓄存款额可达多少?附:对于一组样本数据(小匕)、(,/)、(七,"),其回归直线*=匾+&的斜率和截距的最小二乘估X”Z(%一元)(y-刃xiyi-rixy计值分别为右=T,a=y-bx(-)2登;-怖21-1Z-I【答案】Z=L2,1.4;(2)J=1.2x-2414.4:(3)10.8(千亿元).【分析】(1)由已知表格中的数据求得7N,得到6与3则线性回归方程可求;(2)r=x-2015,z=y-5代入z=1.2r1.4,即可得到N关于X的回归方程;(3)代入=2021求得g值即可.【详解】(1)7=(l+2+3+4+5)=3,z=(0+l+2+3+5)=2.2,z.=l×0÷2×l+3×2+4×3+5×5=45,r2=I2+22+32+42+52=55,/=II=I = 45-5x3x2.2 = 12>55-5×9a = z -Iyi = 2.2 -3×1.2 = -1.4 »z=1.2r-1.4.(2)将f=x-2015,z=y-5代入z=1.2z-1.4,得),-5=1.2(x-2015)-L4,即y=1.2x-2414.4.所以),关于X的回归方程为9=12l2414.4.(3)当x=2021时,y=L2×2021-2414.4=10.8,所以预测到2021年年底,该地储蓄存款额可达10.8(千亿元).【方法四】成果评定法一、单选题1 .(2021高二课时练习)下列关于回归分析的说法中错误的是()A.回归直线一定过样本中心(7,5)B.残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适C.甲、乙两个模型的W分别约为0.98和0.80,则模型乙的拟合效果更好D.两个模型中残差平方和越小的模型拟合的效果越好【答案】C【解析】根据回归直线过样本中心点可判断A选项的正误;利用残差图与模型的拟合效果的关系可判断B选项的正误;利用相关指数与模型拟合效果的关系可判断C选项的正误;利用残差平方和与模型拟合效果之间的关系可判断D选项的正误.【详解】对于A选项,回归直线一定过样本中心(x,y),A选项正确;对于B选项,残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,B选项正确;对于C选项,甲、乙两个模型的正分别约为0.98和0.80,则模型甲的拟合效果更好,C选项错误;对于D选项,两个模

    注意事项

    本文(专题09成对数据的统计相关性、一元线性回归模型及其应用 (3个知识点5个拓展1个突破5种题型3个易错点)解析版.docx)为本站会员(夺命阿水)主动上传,课桌文档仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知课桌文档(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-1

    经营许可证:宁B2-20210002

    宁公网安备 64010402000986号

    课桌文档
    收起
    展开