专题09成对数据的统计相关性、一元线性回归模型及其应用 (3个知识点5个拓展1个突破5种题型3个易错点)原卷版.docx
《专题09成对数据的统计相关性、一元线性回归模型及其应用 (3个知识点5个拓展1个突破5种题型3个易错点)原卷版.docx》由会员分享,可在线阅读,更多相关《专题09成对数据的统计相关性、一元线性回归模型及其应用 (3个知识点5个拓展1个突破5种题型3个易错点)原卷版.docx(24页珍藏版)》请在课桌文档上搜索。
1、专题09成对数据的统计相关性、一元线性回归模型及其应用(3个知识点5个拓展1个突破5种题型3个易错点)【目录】倍速学习四种方法【方法一】脉络梳理法知识点1.相关关系知识点2.样本相关系数知识点3.经验回归方程拓展1.判断变量相关关系的三种方法拓展2.回归系数b的含义拓展3.最小二乘法求回归方程及回归方程的逆用拓展4.经验回归分析“三步曲”拓展5.样本相关系数人决定系数解的应用突破:非线性相关问题【方法二】实例探索法题型1.变量间相关关系的判断题型2.样本相关系数的应用题型3.经验回归方程及其应用题型4.回归效果的刻画题型5.非线性回归分析【方法三】差异对比法易错点1.混淆相关关系与函数关系致误
2、易错点2.对经验回归方程的理解不到位致误易错点3.线性相关系数理解不正确致误【方法四】成果评定法【知识导图】一一知识点L相关关系/一知识点2.样本相关系数/知识点3.经验回归方程/拓展L判断变量相关关系的三种方法r成对数据的统计相关性一拓展2.回归系数力的含义V一拓展3.最小乘法求回归方程及回归方程的逆用J拓展4.经验回归分析“三步曲”、-拓展5.样本相关系数,、决定系数改的应用突破:非线性相关问题【倍速学习四种方法】【方法一】脉络梳理法知识点1.相关关系-相关关系1 .相关关系的定义:两个变量有关系,但没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相关关系.2 .相关关系的分类
3、(1)按变量间的增减性分为正相关和负相关.正相关:当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势;负相关:当一个变量的值增加时,另一个变量的相应值呈现减少的趋势.(2)按变量间是否有线性特征分为线性相关和韭线性相关(曲线相关).线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在二aa附近,我们称这两个变量线性相关;非线性相关或曲线相关:如果两个变量具有相关性,但不是线性相关,我们称这两个变量非线性相关或曲线相关.二、相关关系的直观表示散点图:为了直观描述成对样本数据的变化特征,把每对成对样本数据都用直角坐标系中的点表示出来,由这些点组成的统计图,叫做散点图.例1.(1)单选
4、题(2023下河南省直辖县级单位高二校考期末)下列两个变量中能够具有相关关系的是()A.人所站的高度与视野B.人眼的近视程度与身高C.正方体的体积与棱长D.某同学的学籍号与考试成绩(2)单选题(2022上新疆和田高二校考期末)对于变量孙N有以下四个散点图,由这四个散点图可以判断变量X与)成负相关的是()知识点2.样本相关系数r当厂0时,称成对样本数据正相关;当r0.75,则线性相关较为显著,否则不显著.例2.(2024上天津高三校联考期末)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢学习强国”中挑战答题
5、”模块,他记录了自己连续七天每天一次最多答对的题数如下表:天数X1234567一次最多答对题数),12151618212427777参考数据:x=4,J=19,Z片=140,X.vl2=2695,X=600,62.45,=!J=IZ=I相关系数二S(Xi-可(y-歹)2狂可心f由表中数据可知该老师每天一次最多答对题数y与天数X之间是相关(填正或负),其相关系数(结果保留两位小数)知识点3.经验回归方程1 .一元线性回归模型Y=bx+a+e,称,为丫关于X的一元线性回归模型.其中丫称为因变量或电应变量,称为宜变量或解E(e)=O,D(e)=2释变量,且称为截距参数,女称为斜率参数;e是y与+之间
6、的随机误差,如果e=d那么Y与工之间的关系就可以用一元线性函数模型来描述.2 .经验回归方程(1)相关概念:经脸回归直线:经脸回归方程也称经脸回归函数或经验回归公式,图形称为经脸回归直线.最小二乘估计:求经验回归方程的方法叫做最小二乘法,求得的Aa叫做儿。的最小二乘估计.残差:对于响应变量y,通过观测得到的数据称为观测值,通过经脸回归方程得到的y称为预测值,观测值减去预测值称为残差.(苍-可(M-方iyi-ny力=M=-)2Xi2-nX2Z=IZ=Ia=y-bx(3)决定系数收:K?越大,表示残差平方和越小,即模型的拟合效果越好;K?越小,表示残差平方和越大,即模型的拟合效果越差;方法技巧经验
7、回归方程的求法及应用在散点图中,样本点大致分布在一条直线附近,利用公式求出41可写出经脸回归方程,利用经验回归模型进行研究,可近似地利用经脸回归方程$二送+来预测。方法技巧一元线性回归模型拟合问题的求解策略在一元线性回归模型中,R2与相关系数r都能刻画模型拟合数据的效果.r越大,R2就越大,用模型拟合数据的效果就越好.例3.(2024上青海西宁高三统考期末)家居消费是指居民在日常生活中购买和使用的家具、家电、建材、装修等产品和服务所形成的消费行为.长期以来,家居消费一直是居民消费的重要组成部分,对于带动居民消费增长和经济恢复具有重要意义.某家居店为了迎接周年庆举办促销活动,统计了半个月以来天数
8、X与销售额y(万元)的一组数据(x,y):(3,61),(6,82),(9,91),(12,104),(15,112).通过分析发现X与),呈线性相关.求X与y的样本相关系数(结果保留三位小数);求X与y的线性回归方程=猿+吉(,b的结果用分数表示).W.njxiyi-rixy参考公式:相关系数r=F力=号,=y-x枢欣2L”x;-rc2参考数据:x,2=495,Z=42086,f.=4422,15860126.Z-If=!f三l拓展L判断变量相关关系的三种方法1.解答题.(2023上高二课时练习)国家学生体质健康标准(2014年修订)中,体能监测包含身高、体重、肺活量、50米跑、坐位体前屈、
9、引体向上(女:仰卧起坐)、立定跳远、100O米跑(女:800米跑),据此得到的每项指标都可以按照相应的单项指标评分表进行测量和计分,分别得到相应的数据.这些数据中的任意两组是否都可以作为成对数据进行相关分析?依据你的经验,哪两组数据的相关程度可能最高?哪两组数据的相关程度可能最低?如何通过统计方法检验你的判断?拓展2.回归系数6的含义2.单选题(2023上天津武清高三天津英华国际学校校考阶段练习)有人调查了某高校14名男大学生的身高及其父亲的身高,得到如下数据表:编号1234567891011121314父亲身高/cm17417017316918217218017216816618217316
10、4180儿子身高/cm176176170170185176178174170168178172165182170175180父亲身高1-165-TTl T !I-r 5 0 5 0 58 8 7 7 6Ii 11 H 1 H利用最小二乘法计算的儿子身高Y关于父亲身高X的回归直线为a=0839+28.957.根据以上信息进行的如下推断中,正确的是()A.当X=I72时,y173,若一位父亲身高为172cm,则他儿子长大成人后的身高一定是173CmB.父亲身高和儿子身高是正相关,因此身高更高的父亲,其儿子的身高也更高C.从回归直线中,无法判断父亲身高和儿子身高是正相关还是负相关D.回归直线的斜率可
11、以解释为父亲身高每增加Iem,其儿子身高平均增加0.839Cm拓展3.最小二乘法求回归方程及回归方程的逆用3. (2024全国高三专题练习)近年来,我国新能源汽车技术水平不断进步、产品性能明显提升,产销规模连续六年位居世界首位.某汽车城从某天开始连续的营业天数X与新能源汽车销售总量y(单位:辆)的统计数据如下表所示:从某天开始连续的营业天数X1020304050新能源汽车销售总量W辆6268758189已知可用线性回归模型拟合y与X的关系,请用相关系数加以说明(结果精确到0001);求关于X的经验回归方程y=bx+at并预测该汽车城连续营业130天的汽车销售总量.参考数据:x,=H920,y=
12、28575,52.236./=I/=1参考公式:相关系数=Ylxiyi-hxy2,经验回归方程y = a + bx中斜率与截距的最小二乘估计公xiyi-nxy式分别为3=j,a=y-bx.-应2/-I拓展4.经验回归分析“三步曲”4. (2021下广东河源高二河源市河源中学校考开学考试)现有一环保型企业,为了节约成本拟进行生产改造,现将某种产品产量X与单位成本),统计数据如表:月份123456产量(千件)234345单位成本(元/件)737271736968(1)试确定回归方程=舐+机指出产量每增加1000件时,单位成本平均下降多少?假定单位成本为70元/件时,产量应为多少件?(参考公式:=j
13、H=j,=y-x)(7-)2-/=!/=!(参考数据EXa=1481,xl2=79)Z=IM拓展5.样本相关系数,、决定系数解的应用5. 填空题(2021下安徽六安高二安徽省舒城中学校考阶段练习)甲、乙、丙、丁4位同学各自对4,B两变量进行回归分析,分别得到散点图与残差平方和Z(一丹2如下表:i=l甲乙丙T散点图BB.BB*OAOAOAOA残差平方和115106124103则试验结果体现拟合A,8两变量关系的模型拟合精度高的同学是.6. (2021下黑龙江哈尔滨高二哈九中校考期末)全球化时代,中国企业靠什么在激烈的竞争中成为世界一流企业呢?由人民日报社指导,中国经济周刊主办的第十八届中国经济论
14、坛在人民口报社举行,就中国企业如何提升全球行业竞争力进行了研讨.数据显示,某企业近年加大了科技研发资金的投入,其科技投入X(百万元)与收益(百万元)的数据统计如下:科技投入X1234567收益y19202231405070根据数据特点,甲认为样本点分布在指数型曲线y=23”的周围,据此他对数据进行了一些初步处理.如下表:Z7:/-!EXiyi=lNXiZiZ=I7(,-y)2/=!(-)2=151401239149213413017其中Zj=Iog2X,Z=-2,./Z=I(I)请根据表中数据,建立y关于X的回归方程(系数5精确到O1,用6的近似值算4):(2)乙认为样本点分布在直线丁=比+的
15、周围,并计算得回归方程为9=8.25x+3,以及该回归模型的决定系数(即相关指数)皮=0.893,试计算用,比较甲乙两人所建立的模型,谁的拟合效果更好?(精确到0.001)由所得的结论,计算该企业欲使收益达到1亿元,科技投入的费用至少要多少百万元?(精确到0.1)附:对于一组数据(场,匕),(2,匕),(与,匕),其回归直线方程的斜率和截距的最小二乘法估(w-w)(vf.-v)Yuivi-nuv(vf-vj)2计分别为/=T,a=v-u,决定系数:K=T.参考数据:(w-i7)2IX-而2(vr-v)2万元的统计数据如表:广告费用X2345销售额y26394954根据上表可得回归方程y=9.4
16、x+,据此模型预测,广告费用为6万元时的销售额为()万元A.63.6B.65.5C.72D.67.73 .下面给出四种说法:设“、b、C分别表示数据15、17、14、10、15、17、17、16、14、12的平均数、中位数、众数,则abc在线性回归模型中,相关指数2表示解释变量对于预报变量变化的贡献率,心越接近于,表示回归的效果越好;绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;设随机变量服从正态分布yv(4,22),则P(4)=l.其中不正确的是().AgC.D.4 .(2023上山东青岛高三统考开学考试)已知某设备的使用年限工(年)与年维护费用(千元)的对应数据如下表:X245
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 专题09成对数据的统计相关性、一元线性回归模型及其应用 3个知识点5个拓展1个突破5种题型3个易错点原卷版 专题 09 成对 数据 统计 相关性 一元 线性 回归 模型 及其 应用 知识点 拓展 突破

链接地址:https://www.desk33.com/p-1145444.html