2023-2024学年人教A版必修第二册 9-2-2 总体百分位数的估计 学案.docx
9.2.2总体百分位数的估计新课程标准解读核心素养I.结合实例,理解百分位数的统计含义数学抽象2.能用样本估计总体百分位数数学运算G知识梳理读教材D-基础落实高效学习Ib情境导入一某省学业水平考试结果揭晓,根据规定,0.8%的同学需要补考.问题你知道如何确定需要补考的分数线吗?Ia新知初探.知识点百分位数1.第百分位数的定义一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有上仁的数据小于或等于这个值,且至少有(100-P)%的数据大于或等于这个值.2 .计算一组个数据的第p百分位数的步骤第1步,按从小到大排列原始数据;第2步,计算i=X;第3步,若i不是整数,而大于i的比邻整数为,则第百分位数为第二项数据;若,是整数,则第P百分位数为第i项与第(÷1)项数据的平均数.3 .四分位数第25百分位数,第50百分位数,第75百分数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.你想一想1 .班级人数为50的班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?提示:不是.是指能够考取本科院校的同学占同学总数的百分比.2 .“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?提示:有70%的同学数学测试成绩小于或等于85分.B做一做1 .判断正误.(正确的画“4”,错误的画“X”)(1) 一组数据的百分位数可能是这组数据中的数,也可能不是这组数据中的数.()(2)第0百分位数为这组数据中的最小的数,第100百分位数为这组数据中的最大的数.()(3)一组数据的某些百分位数可能是同一个数.()答案:(1)(2)(3)2.下列关于一组数据的第50百分位数的说法正确的是()A.第50百分位数就是中位数B.总体数据中的任意一个数小于它的可能性一定是50%C.它一定是这组数据中的一个数据D.它适用于总体是离散型的数据解析:A由百分位数的意义可知选项B、C、D错误.3.某读书会有6名成员,寒假期间他们每个人阅读的书本数分别如下:3,2,5,4,3,1,则这组数据的75%分位数为()A.3B.4C.3.5D.4.5解析:B由题意,这组数从小到大排列顺序为:1,2,3,3,4,5,由6X75%=45,可得这组数据的75%分位数为从小到大排列的第5个数为4.故选B.G题型突破析典例O-技法归纳活学活用题型.体百分位数的估计例I考察某校高二年级男生的身高,随机抽取40名高二男生,实测身高数据(单位:cm)如下:171163163166166168168160168165171169167169151168170160168174165168174159167156157164169180176157162161158164163163167161请估计该校高二年级男生身高的第25,50,75百分位数.解把这40名男生的身高数据按从小到大排序,可得151156157157158159160160161161162163163163163164164165165166166167167167168168168168168168169169169170171171174174176180由25%X40=10,50%X40=20,75%X40=30,可知样本数据的第25百分位数为161.5,第50百分位数为166,第75百分位数为168.5.据此可估计该校高二男生身高的第25,50,75百分位数分别约为161.5,166和168.5.通性通法总体百分位数估计需要注意的两个问题(1)总体百分位数估计的基础是样本百分位数的计算,因此计算准确是关键;(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值.口跟踪训练某良种培育基地正在培育一种小麦新品种A,将其种植了25亩,所得亩产数据(单位:千克)如下:421,399,445,359,415,443,367,454,368,375,392,400,423,405,412,427,414,423,430,388,430,357,434,445,451试估计该品种小麦亩产的第80,95百分位数.解:将25个样本数据按从小到大排序,可得357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454由80%×25=20,95%×25=23.75,可知样本数据的第80百分位数为438.5,第95百分位数为第24项数据,为451.据此估计该品种小麦亩产的第80,95百分位数分别约为438.5和451.频数(频率)分布表求百分位数【例2】某工厂有工人100O名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层随机抽样方法(按A类、B类分两层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).(1)A类工人中和B类工人中各应抽查多少人?(2)从A类工人中的抽查结果和从8类工人中的抽杳结果分别如下表和表.表生产能100,110)110,120)120,130)130,140)140,150力分组人数48x53表生产能110,120)120,130)130,140)140,150力分组人数6),3618先确定X,),的值,再分别计算A类工人和8类工人生产能力的样本数据的60%分位数(保留两位小数).解由已知可得,抽样比2=孤=卷,故从A类工人中应抽查250X3=25(人),从6类工人中应抽查750X=75(人).(2)由题意知4+8+x+5+3=25,得x=5,6÷y÷36+18=75,得y=15.A类工人生产能力频率分布表为生产能100,110)110,120)120,130)130,140)140,150力分组频率0.160.320.200.200.12由频率分布表可知,A类工人生产能力在120以下的所占比例为16%÷32%=48%,A类工人生产能力在130以下的所占比例为48%+20%=68%,因此,60%分位数一定位于120,130)内.由120+10X%二次二126,0.68-0.48可以估计人类工人生产能力的样本数据的60%分位数为126.8类工人生产能力频率分布表为生产能110,120)120,130)130,140)140,150力分组频率0.080.200.480.24由频率分布表可知,8类工人生产能力在130以下的所占比例为8%+20%=28%,8类工人生产能力在140以下的所占比例为28%÷48%=76%,因此,60%分位数一定位于130,140)内.由130+10X°6°°2%i36.67,0.76-0.28可以估计6类工人生产能力的样本数据的60%分位数约为136.67.通性通法由频率(频数)分布表求百分位数的方法(1)确定%分位数所在区间。,b)(并计算小于的所有数据的频率A和小于力的所有数据的频率6),即p%(6,八):(2)计算“分位数为+(h-a)X警g(其中一。为组距,拙一A为数据落在凡b)-fa内的频率).Ef跟踪训练从某校随机抽取100名学生,获取了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频率分布表如下:排号分组频数频率10,2)60.0622,4)80.0834,6)17b46,8)220.2258,10)250.25610,12)120.12712,14)a0.06814,16)20.02916,1820.02合计1001(1)求频率分布表中。,6的值;(2)计算50%分位数,并估计是否有50%的学生的阅读时间达到7.68.解:(1)=().06X100=6,6=急=0.17.(2)阅读时间小于6小时的所占比例是0.06+0.08+0.17=0.31,阅读时间小于8小时的所占比例是0.06+0.08+0.17+0.22=0.53,所以50%分位数在6,8)内,所以50%分位数约为6+2×7.73.0.53-0.31因为7.73>7.68,所以估计有50%的学生的阅读时间达到7.68.题型三由频率分布直方图求百分位数【例3】某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了X人,按年龄分成5组(第一组:20,25),第二组:25,30),第三组:30,35),第四组:35,40),第五组:40,45),得到如图所示的频率分布直方图,已知第一组有5人.(1)求x;(2)求抽取的1人的年龄的50%分位数(结果保留整数);(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99,求这10人成绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“一带一路”的认知程度.解(1)第一组频率为0.01X5=0.05,所以丸=六=IO0.(2)由图可知年龄低于30岁的所占比例为40%,年龄低于35岁的所占比例为70%,所以抽取的X人的年龄的50%分位数在30,35)内,由30+5×050040=-32,0.70-0.403所以抽取的X人的年龄的50%分位数为32.(3)把参赛的10人的成绩按从小到大的顺序排列:88,90,92,92,95,96,96,97,98,99,计算10×20%=2,所以这10人成绩的20%分位数为三丝=91,这10人成绩的平均数为工X(88+90+92÷92÷95+96÷96+97÷98+99)=94.3.10评价:从20%分位数和平均数来看,参赛人员的认知程度较高.通tiS法由频率分布直方图求百分位数的思路(1)频率分布直方图中分位数表示左侧小矩形的面积之和等于的分点值;(2)由频率分布直方图求百分位数的方法与由频率分布表求百分位数的方法相同;(3)根据一组数据的直方图来估计这组数据的p%分位数时,直方图的分组越多,组距越小,样本数据的信息损失越少,估计效果越好.Cf跟踪训练为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间80,130上,其频率分布直方图如图所示,你能估计一下60株树木的第50百分位数和第75百分位数吗?0.03()0.0250.0200.0150.010频率组坨80901110120130底部周长/cm解:由题意知在80,100)上的频率为0.4,在100,110)上的频率为0.3,在110,120)上的频率为0.2,可知第50百分位数一定落在区间1()0,110)上,由1OO+1OX三=1OO+W1O3.3;0.7-0.43第75百分位数一定落在区间110,120)上,由110+10×075°7=110+-=112.5.0.9-0.72综上可知,第50百分位数和第70百分位数的估计值分别为103.3cm,112.5cm.因随堂检测,1.下列一组数据的第25百分位数是()2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6A.3.2B,3.0C.4.4D.2.5解析:A把该组数据按照由小到大排列,可得:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i=10X25%=2.5,不是整数,则第3个数据3.2,是第25百分位数.2.以下数据为参加数学竞赛决赛的15人的成绩:78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是()A.90B.90.5C.91D.91.5解析:B把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98.因为15X80%=12,所以这15人成绩的第80百分位数是2=90.5.23 .如图是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,则由直方图得到的25%分位数为()A.66.5B.67C.67.5D.68解析:C第一组的频率为0.010X10=0.1,前两组的频率之和为(0.010÷0.020)X10=0.3,知25%分位数在第二组60,70)内,故25%分位数为60+10×=67.5.故选C.4 .如图是某市2023年4月1日至4月7日每天最高、最低气温的折线统计图,这7天的日最高气温的10%分位数为,日最低气温的80%分位数为.°1234567日期/日765432解析:由折线图可知,把日最高气温按照从小到大排序,得24,24.5,24.5,25,26,26,27,因为共有7个数据,所以7X10%=0.7,不是整数,所以这7天日最高气温的10%分位数是第1个数据,为24C.把日最低气温按照从小到大排序,得12,12,13,14,15,16,17,因为共有7个数据,所以7X8()%=5.6,不是整数,所以这7天日最低气温的80%分位数是第6个数据,为16C.答案:24C16