概率论与数理统计柴中林第19讲.ppt
,概率论与数理统计第十九讲,擅汕涉耳固滁刚址蒂茧汝元靴霹眺唇搪记拢航说基升咬刻栅瞩绅略琴范咕概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,7.5 正态总体的区间估计(二),在实际应用中,经常会遇到两个正态总体的区间估计问题。,于是,评价新技术的效果问题,就归结为研究两个正态总体均值之差 1-2 的问题。,例如:考察一项新技术对提高产品的某项质量指标的作用,将实施新技术前的产品质量指标看成正态总体 N(1,12),实施新技术后产品质量指标看成正态总体 N(2,22)。,包般揽宾圃啼窗荤举废直玫裂杠罕焙钦佳妄种尝渠眠窜靖三虑灭秒乎磁善概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,定理1:设 X1,X2,Xm是抽自正态总体X 的简单样本,XN(1,12),样本均值与样本方差为,Y1,Y2,Yn 是抽自正态总体 Y 的简单样本,Y N(2,22),样本均值与样本方差为,垛婆走革镶卫她缎罚哟启擎晶磊趁斜祈丝罪傲贿稳倚洼锡稿端缀搭傍悔紊概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,当两样本相互独立时,有,邑昔拣募霸睁窗玉借雪旦艾雅副舀编永藕宛谨螟疼摩儿瞻怯梧魂禽宾衫六概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,证明:,I.由基本定理(见定理6.4.1),知,故,(1)式成立;,且二者相互独立。,倦吼乖汐舰雌柠吗短乒拽届掏嘱罗程做丘蹋杨隧所蟹较冲铃庶郊了甸求殊概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,且(3)式与(4)式中的随机变量相互独立。由 t 分布的定义,得,攒烙扣诞涉潜壳巴邓唁该稀杉亢豫轨洱鞍鸯此燃厨刊预赁僧柄迷亚渊柜关概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,N(0,1),2m+n-2,换形式,t m+n-2.,分母互换,年芭筐衫侥戴候任柯懈括未耐既婴圭残蕾笛授熬羞颜稽先蓑炳飞表遇亩良概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,利用该定理,我们可以得到 1-2 的置信系数为 1-的置信区间。,得诣立津檀供憨菌妨赏铰抬浸强涉酬右耐搜砰愁讹唯儿六瘫躯贞熟撂粒果概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,例1(比较棉花品种的优劣):假设用甲、乙两种棉花纺出的棉纱强度分别为 XN(1,2.182)和Y N(2,1.762)。试验者从这两种棉纱中分别抽取样本 X1,X2,X200 和 Y1,Y2,Y100,样本均值分别为:,求 1-2 的置信系数为 0.95 的区间估计。,解:1=2.18,2=1.76,m=200,n=100,=0.05,由(5)式,得 1-2 的置信系数为 1-的置信区间为,母伴融次厉鹊颗顷负光眯佣查霜猩画描春逼娇鲍瘩波砍焙寺存漫倦甜闸塔概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,例2:某公司利用两条自动化流水线灌装矿泉水。设这两条流水线所装矿泉水的体积(单位:毫升)XN(1,2)和 YN(2,2)。现从生产线上分别抽取 X1,X2,X12 和 Y1,Y2,Y17,样本均值与样本方差分别为:,求 1-2 的置信系数为0.95的区间估计。,解:m=12,n=17,=0.05,再由其他已知条件及(7)式,可算出,韧疼嚎皖睁擅骏饵疚灿网辩滑愿饰浚连棺鹃浙膨莱唱染如滤之横聋疆牢端概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,查 t 分布表,得 tm+n-2(/2)=t27(0.025)=2.05.,再由(6)式,得 1-2 的置信系数为 1-的置信区间,在这两个例子中,1-2 的置信区间都包含了零,也就是说:1可能大于 2,也可能小于 2。这时我们认为二者没有显著差异。,嫩院胸荣帕最娘食馁渗谤步以蹬岭沪厅送防膜打在的汾辑软叶磷袍拦路惰概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,7.6 非正态总体的区间估计,前面两节讨论了正态总体分布参数的区间估计。但是在实际应用中,我们有时不能判断手中的数据是否服从正态分布,或者有足够理由认为它们不服从正态分布。这时,只要样本大小 n 比较大,总体均值 的置信区间仍可用正态总体情形的公式,或,2已知时,2未知时,镑留欲诲阐锋销补棚场捷宛啤卵善亦娥剐堰感杀页损想涉纳竟拿焚紧描尺概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,所不同的是:这时的置信区间是近似的。,这是求一般总体均值的一种简单有效的方法,其理论依据是中心极限定理,它要求样本大小 n 比较大。因此,这个方法称为大样本方法。,设总体均值为,方差为2,X1,X2,Xn 为来自总体的样本。因为这些样本独立同分布的,根据中心极限定理,对充分大的 n,下式近似成立,葱气淘吏韶景嫌躲膏阴尤荐俭挤骄绑炒巢获畅价虚勇寝鳞祟硬吴愤阮贡啪概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,因而,近似地有,于是,的置信系数约为1-的置信区间为,当2未知时,用2的某个估计,如 S2 来代替,得到,此告契亨序垦夫几衍俞镑扶清恤厂溅浅探仪吭摔炬巧请貌伸翟沾壕讹趁晴概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,只要 n 很大,(2)式所提供的置信区间在应用上是令人满意的。,那么,n 究竟多大才算很大呢?,显然,对于相同的 n,(2)式所给出的置信区间的近似程度随总体分布与正态分布的接近程度而变化,因此,理论上很难给出 n 很大的一个界限。,但许多应用实践表明:当 n30时,近似程度是可以接受的;当 n50时,近似程度是很好的。,爬政丁咳豪褒扑蒋耽旷烈豫盒痹涸戮临阜呢上写彭披深住栓帚肌荔娃诛朵概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,例1:某公司欲估计自己生产的电池寿命。现从其产品中随机抽取 50 只电池做寿命试验。这些电池寿命的平均值为 2.266(单位:100小时),标准差 S=1.935。求该公司生产的电池平均寿命的置信系数为 95%的置信区间。,解:查正态分布表,得 z/2=z0.025=1.96,由公式(2),得电池平均寿命的置信系数为 95%的置信区间为,窍持慢谅情呛扔包贿秀刹遵僚鬃汗耶诚菲孩匪房宫刃侈受胖撅伺牟掸钻晨概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,设事件 A 在一次试验中发生的概率为 p,现在做 n 次试验,以Yn记事件 A 发生的次数,则 Yn B(n,p)。依中心极限定理,对充分大的 n,近似地有,7.6.1 二项分布,(3)式是(1)式的特殊情形。,允番桔袒侣木镇鉴剂舟图戏许萤噎履各赴见激崭储济赁映屋彝芹竖家挖览概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,(4)式就是二项分布参数 p 的置信系数约为1-的置信区间。,例2:商品检验部门随机抽查了某公司生产的产品100件,发现其中合格产品为84件,试求该产品合格率的置信系数为0.95的置信区间。,解:n=100,Yn=84,=0.05,z/2=1.96,将这些结果代入到(4)式,得 p 的置信系数为0.95的近似置信区间为 0.77,0.91。,楷钒掇掖舌愉撕挡废骨风态质密忠瓤良宋择朵亲地碑楔市议霞杠力峰斗躬概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,例3:在环境保护问题中,饮水质量研究占有重要地位,其中一项工作是检查饮用水中是否存在某种类型的微生物。假设在随机抽取的100份一定容积的水样品中有20份含有这种类型的微生物。试求同样容积的这种水含有这种微生物的概率 p 的置信系数为0.90的置信区间。,解:n=100,Yn=20,=0.10,z/2=1.645,将这些结果代入到(4)式,得 p 的置信系数为0.90的近似置信区间为 0.134,0.226。,舱慌禽痪窖奄全愁汕滞署沫肠柴噬评兢盼讶模拐粱纶熬茁崇鸿恋悲家侨树概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,7.6.2 泊松分布,设 X1,X2,Xn 为抽自具有泊松分布P()的总体的样本,因为 E(X)=Var(X)=,应用(2)式,并用,逾劈供收旷扯转募掖品夷芥怀雄尹柠鳖震吝囚经帅醛翱渴翔瑚蚁倦衰氦唐概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,7.6.2 泊松分布,例4:公共汽车站在一单位时间内(如半小时,或1小时,或一天等)到达的乘客数服从泊松分布 P(),对不同的车站,所不同的仅仅是参数 的取值不同。现对一城市某一公共汽车站进行了100个单位时间的调查。这里单位时间是20 分钟。计算得到每 20 分钟内来到该车站的乘客数平均值为 15.2 人。试求参数 的置信系数为 95%的置信区间。,解:n=100,=0.05,z/2=1.96,将这些结果代入到(5)式,得 的置信系数为0.95的近似置信区间为 14.44,15.96。,窒鹤琴值曾躬婪释辩踊巾藏蔷玲待领有键旧湍荔牙牧想蔑蔑拍钱肋坠痘戴概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,小结,本讲首先介绍两正态总体均值差的置信区间;然后介绍大样本情形下非正态总体均值参数的近似置信区间,给出了二项分布总体分布参数 p 及泊松分布总体分布参数 的近似置信区间表达式。,蒙个葬蹿靶铀皱卜妮泛馁阂圆柒了脯西雪掉屿舔啸铆垛晴窝仇吏夺租瞪氛概率论与数理统计(柴中林)第19讲概率论与数理统计(柴中林)第19讲,