2023-2024学年人教A版选择性必修第三册 8-2一元线性回归模型及其应用 学案.docx
8.2一元线性回归模型及其应用素养目标定方向®学习目标1 .结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义.了解最小二乘法原理.掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.2 .针对实际问题,会用一元线性回归模型进行预测.3 .了解随机误差、残差、残差图的概念.核心素养1 .通过对散点图、线性回归的分析,培养数据分析素养.2 .借助回归模型的建立,培养数学建模、数据分析及数学运算素养.A必街知识探新知、ZZ知识点1一元线性回归模型Y=bx+a-e,一元线性回归模型的完整表达式为、八八/、2其中V称为因变量或响应变量,X称为自变量或解释变量:a,力为模型的未知参数,e是?与H+a之间的机误差.想一想:具有相关关系的两个变量,其样本点散布在某一条直线y=6x+a的附近,可以用一次函数尸以+a来描述两个变量之间的关系吗?提示:不能.练一练:下列说法不正确的是(C).在回归模型中,变量间的关系是非确定性关系,因变量不能由自变量唯一确定B.在函数模型中,变量间的关系是确定性关系,因变量由自变量唯一确定C.在回归模型中,变量X和y都是普通变量D.在回归模型中,回归系数可能是正的也可能是负的解析在回归模型中,X是解释变量,y是响应变量,当解释变量取值一定时,响应变量的取值带有一定的随机性.知识点2最小二乘法与经验回归方程(D最小二乘法=+称为y关于X的经验回归方程,也称经验回归函数或经验回归公式,其图形称为里验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做6,a的最小二乘估计.(2)经验回归方程的系数计算公式经验回归方程的计算公式的计算公式=x+nn2(XLX)(%一1ZXXy/=I/=1y(a;XyZ,一X2j=l/=1=y-X(3)经验回归方程的性质经验回归方程一定过点“上J;一次函数=x+的单调性由的符号决定,函数递增的充要条件是0;的实际意义:当X增大一个单位时,增大个单位.练一练:如果记录了必y的几组数据分别为(0,1),(1,3),(2,5),(3,7),那么y关于X的经验回归方程必过点(D)A. (2, 2)C. (1,2)B.(1.5,2)D.(1.5,4)解析因为:=。+?2+3=1.5,1+3+5+7=4,所以经验回归方程必过点(L5,4).知识点3残差与残差分析(1)残差对于响应变量K,通过观测得到的数据称为一观测值通过经验回归方程得到的称为.预测值,观测值减去预测值称为残差.残差分析残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.(3)对模型刻画数据效果的分析残差图法:在残差图中,如果残差比较均匀地集中在以横轴为对称轴的水平带状区域内,则说明经验回归方程较好地刻画了两个变量的关系;残差平方和法:残差平方和邑(匕一越小,模型的拟合效果越好;法:可以用=1一来比较两个模型的拟合效果,川越大,模型拟合效果越好,而越小,模型拟合效果越差.练一练:甲、乙、丙、丁四位同学在建立变量X,y的回归模型时,分别选择了4种不同模型,计算可得它们的决定系数#分别如表:甲乙丙T*0.980.780.500.85哪位同学建立的回归模型拟合效果最好(A)A.甲B.乙C.丙D.T解析决定系数越大,表示回归模型的拟合效果越好.关健能力攻重旗题I型I探1究题型一求经验回归方程典例1随着网络的普及,网上购物的方式已经受到越来越多年轻人的青睐,某家网络店铺商品的成交量x(单位:件)与店铺的浏览量双单位;次)之间的对应数据如下表所示:x/件24568力次3040506070(1)根据表中数据画出散点图;(2)根据表中的数据,求出y关于X的经验回归方程;当这种商品的成交量突破100件(含100件)时,预测这家店铺的浏览量至少为多少?分析以横轴表示成交量,纵轴表示浏览量,画出散点图,若散点图显示两变量线性相关,则依据公式求解经验回归方程,再利用经验回归方程进行估计.解析(1)散点图如图所示.(2)根据散点图可得,变量X与y之间具有线性相关关系.552X-5xy根据数据可知,X=5,y=50,xiyi=1390,E北=145,代入公式得二lIIEY-5/tI1390-5X5X50_-145-5×52-=7,=y-X=50-7X5=15.故所求的经验回归方程是=7x+15.(3)根据上面求出的经验回归方程,当成交量突破100件(含100件),即x=2100时,715,所以预测这家店铺的浏览量至少为715次.规律方法经验回归分析的步骤(1)收集样本数据,设为(为,y,)(i=l,2,,)(数据一般由题目给出).(2)作出散点图,确定筋y具有线性相关关系.(3)计算X»y,xnTfXiYi.J=IJ三l(4)代入公式计算相关系数,确定相关性的强弱.(5)代入公式计算,写出经验回归方程="+.(6)利用经验回归方程进行预测.10对点训练佩戴头盔是一项对家庭与社会负责的表现,某市对此不断进行安全教解析(1)由表中数据知,1+2+3+4 5X =4=2f-=l2150÷l050÷1 000÷,9001育.下表是该市某主干路口连续4年监控设备抓拍到的驾驶员不戴头盔的统计数据:年度2020202120222023年度序号1234不戴头盔人数y125010501000900(D请利用所给数据求不戴头盔人数y与年度序号X之间的经验回归方程=x+;(2)估算该路口2024年不戴头盔的人数.050,ZXM-4XyIqqtx-in500_c所以=喋_a=Tl0,所以=y=1050-(-no)×=4 5UNbN-4T2/=I1325,故所求回归直线方程为=-110x+l325.(2)令x=5,则=-110X5+1325=775,则估算该路口2024年不戴头盔的人数为775人.题型二户的求解与回归模型的拟合典例2我国在第七十五届联合国大会上提出:“中国将提高国家自主贡献力度,采取更加有力的政策和措施,二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和.”减少碳排放,实现碳中和,人人都可出一份力.某中学数学教师组织开展了题为“家庭燃气灶旋钮的最佳角度”的数学建模活动.实验假设:烧开一壶水有诸多因素,本建模的变量设定为燃气用量与旋钮的旋转角度,其他因素假设一样:由生活常识知,旋转角度很小或很大,一壶水甚至不能烧开或造成燃气浪费,因此旋转角度设定在10°到90°之间,建模实验中选取5个代表性数据:18。,36°,54°,72°,90°.某数学建模小组收集了“烧开一壶水”的实验数据,如表:项目旋转角度开始烧水时燃气表度数/dm?水烧开时燃气表度数d18°9080921036°8958908054°8819895872。8670881990°84988670以X表示旋转角度,y表示燃气用量.(D用列表法整理数据(筋y);立旋转角度:度)1836547290y(燃气用量:dm3)(2)假定x,y线性相关,试求经验回归方程=x+;(注:计算结果精确到小数点后三位)(3)计算(2)中所求模型的决定系数,评价此模型的拟合效果.(注:计算结果精确到小数点后两位)5 5_5_5_参考数据:y=712,ZU-7)(-7)=1998,Z(a,-T)2=3240,(y-J)2/=I/=1/=1/=I=1501.2,5(一,)2*269.1.解析整理数据如表:(旋转角度:度)1836547290双燃气用量:Clm3)130122139149172Z(品X)(y-y)/=11998(2)X=54,y=142.4,=Q询=0.617,5JquU-T)2/-1=142.4-0.617X54=109.082,故回归直线方程为=0.617x+109.082.(3)计算(2)中所求模型的决定系数此模型的拟合效果较好.规律方法决定系数/、残差图在回归分析中的作用1(y.-y.)2(D决定系数#是用来刻画回归效果的,由,=1-'T可知,越大,意味着残差1(y.-y)2I三I平方和越小,也就是说模型的拟合效果就越好;(2)残差图也是用来刻画回归效果的,判断依据是残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预测的精度也越高.|Q对点训I练某运动员训练次数与训练成绩之间的数据关系如表:次数(X)3033353739444650成绩(。3034373942464851(D作出散点图;求出经验回归方程;(3)作出残差图;(4)计算",并说明运动员的训练次数对成绩的影响占百分之几.解析(I)作出该运动员训练次数X与成绩'的散点图,如图所示.由散点图可知,它们之间具有相关关系.y605040302010102()30405()60V_88(2)T=39.25,7=40.875,xi=2656,ZMM=I3180,/=IZ=IZMyL8xy/-l所以=*1.0415,Z必一8X2/=IyX=0.003875,所以经验回归方程为=Lo415-0.003875.(3)残差分析:下面的表格列出了运动员训练次数和成绩的原始数据以及相应的残差数据.Xy=y3030-1.24113334-0.365635370.551437390.468439421.385444460.177946480.09495051-1.0711作残差图如图所示.残差21.5由图可知,残差点比较均匀地分布在水平带状区域内,说明选择的模型比较合适.(4)计算而%0.9855,说明了该运动的训练次数对成绩的影响占98.55%.题型三非线性经验回归问题典例3某公交公司推出扫码支付优惠乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引了越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用X表示推出的天数,y表示每天使用扫码支付的人次(一人次等于十人),统计数据如下表:X1234567y611213466IOl196根据以上数据,绘制了如图所示的散点图.(D根据散点图判断,在推广期内,=x+与=cd(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数X的经验回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中的数据,求y关于X的经验回归方程,并预测活动推出后第8天使用扫码支付的人数.参考数据:yVEM匕/=I/=IIO0-5462.141.54253550.123.47其中匕=Ig%,V=亍z%.I分析由散点图可判断X,IK之间的关系符合指数型函数模型,选择=。"进行拟合,然后取对数,进而求出经验回归方程.解析(D根据散点图判断=C-"适宜作为扫码支付的人次y关于活动推出天数X的经验回归方程类型.(2)=c",两边同时取常用对数得Ig=Ig(C")=Igc+lgdx.设Ig=K.*.r=lgc÷lgdx.77.T=4,-7=1.54,Z必=140,ZxM=50.12./=17=17_EXiVL7XV50.12-7X4X1.547_八Ag4"二=140-7×42=诋=°25-7T2/=I把点(4,1.54)代入F=Ige+lgdx,得Ige=0.54,v=0.54+0.25*,lg=0.54+0.25%y关于X的经验回归方程为=IOa5"°皿=10<>5io。,=?47o25x.把x=8代入,得=3.47X1()2=347(人次).故预测活动推出后第8天使用扫码支付的人数为3470.规律方法求非线性经验回归方程的方法(D非线性经验回归方程的求解,一般可以根据散点图选取合适的非线性回归模型,或根据已知条件选取拟合程度较好的非线性回归模型,再通过变换,转化为求线性经验回归方程,最后还原即可.(2)非线性经验回归方程常见形式有以下几种:=a+6(-c)2,=a+MnU-c),=a+b-c,=3+§和=就/'.其中=+6(才一0)2,=a+Z4n(-c),=a+ZaJx-c,=&+§可通过变量替换(换元)求解;=Rr可通过先两边取对数,再变量替换(换元)求解.IIlO对点训练某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费双单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费人和年销售量Ha=I,2,,8)的数据作了初步处理,得到下面的散点图及一些统计量的值.年销售量九6206.*580560480.一_343638404244464850525456年宣传费/千元XyWa-y/=I(电wr)2/=1(XLX)J=I(匕一y)(电w)J=(匕一y)46.65636.8289.81.61469108.8表中Wi=于i,W=RE侑.°/=1(1)根据散点图判断,y=a+bx与y=c+入哪一个适宜作为年销售量y关于年宣传费X的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于X的回归方程;(3)已知这种产品的年利润Z与筋y的关系为z=0.2yx.根据的结果回答下列问题:年宣传费x=49时,年销售量及年利润的预报值是多少?年宣传费X为何值时,年利润的预报值最大?附:对于一组数据(-F1),(如,(f),其回归直线=+的斜率和截距的最n(ULU)(VV)/-1小二乘估计分别为=,=V-U.(S-吃)2/=1解析(D由散点图可以判断,y=c+班适宜作为年销售量y关于年宣传费X的回归方程类型.(2)令=L先建立y关于“,的经验回归方程.8_Zw-w)yi-y)J-T*108.8由于=-r-=68,=y-犷=563-68X6.8=100.6,81bZ(WLW)2/=1所以y关于犷的经验回归方程为=IOo.6+68%因此y关于X的经验回归方程为=IoO.6+6队.(3)由(2)知,当X=49时,年销售量y的预报值=Ioo.6+6队/西=576.6(1),年利润Z的预报值=576.6X0.2-49=66.32(千元).根据(2)的结果知,年利润Z的预报值=0.2(100.6+68x)-A=-+13.6+20.12.所以当、=写=6.8,即x=46.24时,取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.课堂检测同双基1 .关于回归分析,下列说法错误的是(D).回归分析是研究两个具有相关关系的变量的方法B.散点图中,解释变量在X轴,响应变量在y轴C.回归模型中一定存在随机误差D.散点图能明确反映变量间的关系解析用散点图反映两个变量间的关系时,存在误差.2 .关于残差图的描述错误的是(C)A.残差图的横坐标可以是样本编号B.残差图的横坐标也可以是解释变量或预报变量C.残差点分布的带状区域的宽度越窄相关指数越小D.残差点分布的带状区域的宽度越窄残差平方和越小解析残差点分布的带状区域的宽度越窄,说明模型拟合精度越高,则残差平方和越小,此时,相关指数齐的值越大.3 .根据如下样本数据:X23456y42.5-0.5-2-3得到供经验回归方程为=x+,则(B)A.>0,>0B.>0,<0C.<0,>0D.<0,<0解析由题干表中的数据可得,变量y随着X的增大而减小,则<0,又回归方程为=X+经过(2,4),(3,2.5),可得>0.4 .某种产品的广告支出费用(单位:万元)与销售额爪单位:万元)的数据如表:X24568y3040605070已知,关于X的经验回归方程为=6.5x+17.5,则当广告支出费用为5万元时,残差为10.解析当x=5时,=6.5X5+17.5=50,表格中对应尸60,于是残差为6050=10.