中科大概率论与数理统计讲义01事件与概率.docx
概率论与数理统计讲义第一章事件与概率1?1.1概率论发展简史 1?1.2概率论的几个基本概念 1?1.2.1随机试验和随机事件 1?1.2.2事件的运算 2?1.2.3概率的定义及性质 4?1.2.4条件概率 6?1.2.5全概率公式和BayeS公式 8?1.2.6事件的独立性 10第二章随机变量及其分布13?2.1随机变量的概念 13?2.2离散型随机变量 14?2.2.1 0-1 分布 15?2.2.2 二项分布 16?2.2.3 POiSSorl分布16?2.2.4离散的均匀分布 18?2.3连续型随机变量 18?2.3.1正态分布 21?2.3.2指数分布 22?2.3.3均匀分布 24?2.4多维分布 24?2.5边缘分布 28?2.6条件分布和随机变量的独立性 29?2.6.1条件分布 29?2.6.2随机变量的独立性 32?2.7随机变量的函数的概率分布 33第三章随机变量的数字特征41?3.1数学期望(均值)及中位数 42?3.1.1数学期望 42?3.1.2数学期望的44?3.1.3条件期望 4573.1.4 中位数 47?3.2方差、标准差和矩 48?3.2.1方差和标准差 48?3.2.2 矩50?3.3协方差和相关系数 50?3.3.1协方差 50?3.3.2相关系数 51?3.4其他一些数字特征与相关函数 52?3.5大数定律和中心极限定理54?3.5.1大数定律 54?3.5.2 中心极限定理 55第四章数理统计的基本概念及抽样分布58?4.1 引言58?4.1.1什么叫数理统计学 58?4.1.2数理统计学的应用61?4.1.3统计学发展简史 63?4.2数理统计的若干基本概念64?4.2.1 总体和样本 6424.2.2样本的两重性和简单随机样本 66?4.2.3统计模型 67?4.2.4统计推断 68?4.3 统计量 69?4.3.1统计量的定义69?4.3.2若干常用的统计量70?4.4三大分布一2,t, F分布及正态总体样本均值和样本方差的分布71?4.4.1 2 分布71?4.4.2 吩布73?4.4.3 F 分布 74?4.4.4正态总体样本均值和样本方差的分布76?4.4.5几个重要推论76第五章参数估计79?5.1 点估计 79?5.1.1矩估计方法 79?5.1.2极大似然估计方法 81?5.1.3点估计的优良准则85?5.2 区间估计 86?5.2.1置信区间 87?5.2.2置信界 89?5.2.3确定样本大小90第六章假设检验91?6.1基本概念和问题的提法 91?6.1.1零假设,对立假设,两类错误,拒绝域,显著性水平,功效 91?6.1.2假设检验问题的提法 93?6.1.3检验统计量的选取及假设检验的步骤94?6.2重要参数检验 95?6.2.1 一样本正态总体均值和方差的检验 95?6.2.2两样本正态总体的情形 99?6.2.3成对数据 101?6.2.4 0-1分布中未知参数P的假设检验 102?6.3拟合优度检验 103?6.3.1离散总体情形 103?6.3.2列联表的独立性和齐一性检验 105?6.3.3连续总体情形 107第一章事件与概率教学目的S1)掌握随机事件的概念和相关运算.2) 了解概率的不同定义,掌握古典概型的基本计算.3)掌握条件概率的概念,熟练运用全概率公式和BayeS公式.4)掌握事件独立的概念和有关运算.?1.1概率论发展简史概率论起源于17世纪,现在公认是1654年PaSCal与Fermat就赌博中的数学问题所展 开的讨论,在讨论中提出了一些基本概念,最典型的例子是如何分赌本的问题.两个赌 徒相约赌若干局,谁先赢S局就算谁赢.由此提出期望的概念.之后几个数学大家HUygens, Bernouli1 J, De MoiVre等研究了这个问题,BerTlOUIi对频率与概率接近这一事实给予了 理论上的阐述. 1812年LaPIaCe在分析概率论中最早叙述了概率论的几个基本定理, 给出了古典概率的明确定义.1814年在概率的哲学探讨一书中,记载了一个有趣的统 计故事,根据伦敦、彼得堡、柏林和全法国的统计资料,得出几乎一致的男婴和女婴出生 的比例为22:21,即男婴比例为51.16%,或男婴与女婴的比值为104.76:100,可是统计1745- 1784年整整40年巴黎男婴的出生率时,得到的比例为25:24 (104.17:100),调杳研究后发现 巴黎人有遗弃男婴的陋习.1900年Hilbert在第二届世界数学家大会上提出了23个有名的 问题,主体是对新世纪数学发展方向的探讨.关于建立概率论的公理体系是他所提的 第六个问题“借助公理来研究那些在其中数学起重要作用的物理科学;首先是概率和力 学”.随后PoinCare,Borel等都对概率论公理体系的建立做出了努力,1933年苏联的大数 学家KOIme)gorov(1903-1987)正式提出了概率论的公理体系.概率论从此得到迅速的发展, 在此基础上,数理统计也得到了迅速的发展.?1.2概率论的几个基本概念?1.2.1随机试验和随机事件随机现象:自然界中的客观现象,当人们观测它时,所得结果不能预先确定,而仅仅 是多种可能结果之一 .举例说明随机现象.随机试验:随机现象的实现和对它某个特征的观测.随机试验中要求试验的结果至少2个,每次试验或观测得到其中的一个结果,在试 验和观测之前不能预知是哪个结果发生。此外,要求在相同的条件下能重复试验。如观测把硬币抛4次后正面向上的次数;观测某地的温度变化;某电话总机单位时间 内转接的电话次数.定义1.2.1.基本事件:随机试验中的每个单一结果,它犹如分子中的原子,在化学反应 中不能再分,所以有“基本”两字.如把硬币抛3次后有8种可能结果:正正正、正正反、正反正、反正正、正反反、反IE 反、反反正、反反反.这8种可能结果的每一个都是基本事件.定义1.22随机事件:简称事件,在随机试验中我们所关心的可能出现的各种结果,它 由一个或若干个基本事件组成.随机事件常用大写英文字母A, B, C, D等表示.如果用语言表达,则要用花括号括起 来.定义1.2.3.样本空间:随机试验中所有基本事件所构成的集合,通常用。或S表示.例1.2.1.掷一枚子,观察出现的点数.则。=1,2, 3, 4, 5, 6).例1.2.2.考察某一地区的年降雨量,则 = xl VXVT),这里T表示某个常数,表示 降雨量不会超过T.定义1.2.4.必然事件(Q):在试验中一定会发生的事件;不可能事件():在试验中不可能发生的事件.?1.2.2事件的运算可以证明,把样本空间中的基本事件与空间中的点相对应,则事件与集合相对应,因 此事件运算与集合运算可以建立一一对应关系.1 .子事件A c B:事件A发生蕴含事件B一定发生,则事件A称为事件B的子事件,记 为A c B .若A c B ,且B c A,则称事件A与事件B相等,记为A = B .2 .事件的和(AUB):事件A和事件B中至少有一个发生的这一事件称为事件A和事 件B的和,记为AuB .3 .事件的积(A U B):事件A和事件B同时发生这一事件称为事件A和事件B的积,记 为AU B.如果A U B = ,则称A和B不相容,即事件A和B不能同时发生.4 .对立事件Ac(或Q): A不发生这一事件称为事件A的对立事件(或余事件).5 .事件A和事件B的差A-B:事件A发生而事件B不发生这一事件称为事件A和事件B的 差,记为A-B,或等价的,ABc.De MOrgan对偶法则:AuB =Jn 力,AnB= .J u n,上面公式可以推广到n个事件:nU n .Ai =?1.2.3概率的定义及性质1 .概率的定义什么叫概率?直观地讲,概率是随机事件发生可能性大小的数字表征,其值在0和1之 间,换句话说,概率是事件的函数.如何求出事件A的概率(记为P(A)?古典概型:有两个条件,第一,(有限性)试验结果只有有限个(记为n),第二,(等可能性)每个基本事件发生的可能性相同.为计算事件A的概率,设A中包含m个基本事件,则定义事件A的概率为P (A)=-n记号:为方便起见,以#(B)记事件B中基本事件的个数,因此,(2)概率的统计定义古典概型的两个条件往往不能满足,此时如何定义概率?常用的一种方法是把含 有事件A的随机试验独立重复做n次(BernoUli试验),设事件A发生了“次,称比值为 事件A发生的频率,当n越来越大时,频率会在某个值P附近波动,且波动越来越小,这个 值P就定义为事件A的概率.注意:为什么不能写为Iimn。讨=p?因为1不是n的函数.几个例子:英文字母被使用的频率是相当稳定的;福尔摩斯探案集第四本跳舞的 小人,福尔摩斯用频率破了丘比特和埃尔茜之间联络密码;1872年英国人Shix, W把算 到707位,194451945.3数学家法格逊认为的小数位的数字对0到9应该是等可能的,但核 对ShiX的结果发现数字7太少,故对ShiX的结果有怀疑,重新计算发现前527位是正确的, 后面不对了.计算机出现后,法国人让盖尤计算了的前100万位小数,发现各个数字出 现的频率相同.(3)主观概率关于概率的统计定义,我们可能会想到,如果试验不能在相同的条件下独立重复很 多次时该怎么办?还有人们常谈论种种事件出现机会的大小,如某人有80%的可能性办 成某事.如某人有80%的可能性办成某事.另一人则认为仅有50%的可能性.即我们常常 会拿一个数字去估计这类事件发生的可能性,而心目中并不把它与频率挂钩.这种概率 称为主观概率,这类概率有相当的生活基础.在金融和管理等方面有大量的应用,这一 学派称为BayeS学派,近来得到越来越多的认可.但是当前用频率来定义概率的频率派 仍是数理统计的主流.焦点是频率派认为概率是客观存在,不可能因人而异. (4)概率的公理化定义对概率运算规定一些简单的基本法则,(i)设A是随机事件,则0 <P(A)<1,(Ii)设C为必然事件,则P(Q) = 1,(iii)若事件A和B不相容,则P(A u B) = P (A) ÷ P(B),为了对可数无穷个事件仍能成立,我们要把上面公式中的两个事件推广到可数无穷个两 两不相容的事件序列OOP ( n Ai) = P (Ai)i= 1i=12 .古典概率计算的几个例子计算古典概率,主要用到排列组合的知识.复习选排列,重复排列和组合公式有关知识.例1.2.3. 一个班有r个人,不计2月29日出生的(即假定一年为365天),问至少有两人同 一天生日的概率是多少?要点:本问题中的样本空间是什么?重复排列,(3)先计算余事件例124.盒中有32只红球,4只白球,从中任摸2球,求两球中至少有一个白球的概率.要点:(1)样本空间可以考虑为所有可能的组合,也可以考虑为所有可能的选排列, 有些问题中只能考虑其中之一,具体问题具体分析,(2)本题可以直接计算随机事件的概率,也可以先计算对应的余事件的概率,然后得 到所需事件的概率.?1.2.4条件概率1 .条件概率的定义一般讲,条件概率就是在知道了一定的信息下所得到的随机事件的概率.如两个 工厂A和B生产同一品牌的电视机,商场中该品牌有个统一的次品率,比如05%,如果你 从某个途径知道该商场的这批电视机是A厂生产的,则你买到的电视机的次品率不再 是0.5%,而应该比0.5%要小,这个概率就是条件概率,即你在知道了这批电视机是A厂生 产的附加条件下的概率就是条件概率.保险中应用的存活人数死亡率也是条件概率.定义1.25设事件A和B是随机试验C中的两个事件,P (B) > O ,称P (AIB)P(B)为事件B发生条件下事件A发生的条件概率.注1.2.1. P (A)和P(A旧)是不同的两个概率.如图,设矩形A的面积为1,则P(A)表示A的 面积,而P(AIB)表示在B中,A所占的比例,即AB这块面积在B中所占的比例.也可以从概率的统计定义,即用频率来近似概率这一角度来理解条件概率.设在n次 独立试验中,事件A发生了nA次,事件B发生了帕次,事件AB发生了ab次,事件B发生 下事件A发生的频率为ABP (AB)QBP(B)注122事实上,我们所考虑的概率都是在一定条件下计算的,因为随机试验就是在一 定的条件下进行的,所以样本空间是相对而言的.如果把在一定条件下的事件试验看成 无条件的,则在补充条件下进行的事件试验的结果一般而言相对于原有结果要少,即样 本空间改变了 .所以所得随机事件的概率一般是不相同的.例1.25有10个产品,内有3个次品,从中一个个地抽取(不放回)检验,问第一次取到次 品后第二次再取到次品的概率.解:样本空间Q是从10个产品中有序取出2个产品的不同方法,这是一个排列问题,易知#。= 10 x96, #A = 3,故P (BIA)3=丝/9P(A) MlU90,记A =第一次取出的是次品, B =第二次取出的是次品, #(AB)=注意,P (BIA) = 2/9 P (A) = 3/10.例126.有三张相同的卡片和一顶帽子,第一张卡片两面都画有圈,第二张卡片一面画 圈,一面画星,第三张卡片两面都画星.现在庄家把卡片放在帽中摇晃,然后让你任取一 张,把它放在桌上,设你看到卡片上面的图案为圈,然后庄家与你打赌下面的图案与上 面一样时算庄家赢,不一样是为你赢.请问这样的赌博是否是公平的?这是著名数学家,信息论的创建者之一A. WeaVer设计的,他曾在50年的科学美国 人上介绍过这个例子.请大家想一想,很有意思.例1.2.7.掷两个子,观测出现的点数,分别以X和y表示第一和第二颗子掷出的点数, 记A = (x, y) : X + y > 9 , B = (x, y) : x > y,求P(A旧)和P(BIA).容易算出P(AIB) = 2/15 , P (BIA) = 1/3,这说明这两个条件概率不是一回事.2 .乘法定理由 P(A旧)=夕拼 ÷ P(AB) = P (AIB)P (B)由归纳法容易推广为n个事件同时发生的概率有如下公式:P (AlA2 . . . An) = P (Ai)P (A2IA1) . . . P (AIAl . . . AnZL 1)上面公式的右边看似麻烦,其实在实际中很容易算出.在没有给出n个事件之间相 互关系时,这是计算n个事件同时发生的一个重要公式.例128.某人忘了某饭店电话号码的最后一个数字,因而随意拨号,问他三次之内拨通 电话的概率.解:令A=第i次打通电话, i = 1,2, 3 ,则P (3次内拨通电话)=P(AlnA2 n A3)=I-P(AIA 2A 3)-9 87 A 0=1 0.3I(M)K?1.2.5全概率公式和BayeS公式1.全概率公式定义1.2.6.设Bi, B2 , Bn是样本空间。中的两两不相容的一组事件,即BiBj = , i # j ,且满足TCBi = ,则称B, B2 , Bn是样本空间。的一个分割(又称为完备事件 群,英文为PartitiOn).全概率公式:设B1, B2 . . . . Bn是样本空间。的一个分割,A为C中的一个事件,则P (A) = P (ABi)P (Bi)i= 1目的:有时不容易直接计算事件A的概率,但是在每个B上A的条件概率容易求出.注意:应用中最重要的是验证B, B2 . . Bn构成样本空间的一个分割.例129.设某厂产品的一个零部件是由三家上游厂商供货的.已知有一半是A厂提供 的,B厂商和C分别提供25% .已知厂商A和B的次品率都是2%, C的次品率为4%,从 该厂产品中任取一个产品,问该产品的这个零部件是次品的概率.解:记Bi =取到的产品是Bi厂生产的, i=1,2,3,易见Bi, B2 , B3构成样本空间的一个 分割,且P(BI) = 0.5, P (B2)= P (B3)= 0.25, P (AB) = P (AB2) = 0.02, P (AB3) = 0.04, 由全概率公式马上得到P (A) = 0.02 X 0.5 + 0.02 X 0.25 + 0.04 x 0.25 = 0.025例1210 一条家狗在野营后走失了,猜想狗有三种可能去向:A :它已回家,B:仍在原地啃骨头,C:已走失到附近的树林中去了 .从狗的习性可估计上述三种可能性分别为1/4, 1/2, 1/4 . 一个小孩被派回去找狗,如 果狗仍在原地啃骨头,小孩能找到的可能性为9。,如果狗已走失到附近的树林中去了, 则小孩能找到的可能性为5。 .问小孩能找到狗的概率.解:可以分析得出狗的三种去向构成样本空间的一个分割,小孩能在不同情况下找到狗 的概率是条件概率,如果狗已回家,小孩能找到狗的概率为0由全概率公式可以算出小 孩能找到狗的概率为23/40 = 57.5%.设B, B2 , . . . Bn是样本空间的一个分割,A为。中的一个事件,P (Bi) >0,i = 1,2, . , n, P (A) > 0,则P (BiA)=P(.4)P()?.! P(ui)P(aj什么情况下用BayeS公式?由公式知,分母就是事件A的概率,而分子和等式左边的 条件概率中的条件正好反过来.所以我们知道在因果关系互换时必须用BayeS公式.例1.2.11. 一种诊断某癌症的试剂,经临床试验有如下记录:有癌症病人阳性的概率 为95%,无癌症病人阴性的概率为95%.现用这种试剂在某社区进行癌症普查,设该社区 癌症发病率为O. 5%,问某人反应为阳性时该人患癌症的概率.解:设A =反应为阳性, C =被诊断者患癌症,由题意,P (AC) = 0.95, P (4 C = 0.95, P (C) = 0.005,现在要算的是P(CIA).这是典型的因果关系互换,只能用BayeS公式.P(CIA)=P(Ale)P(C)P (AC)P (C) + P (Ar)P ( C)0.95 X 0.0050.95 X 0.005 + 0.05 X 0.9950.087 = 8.7%这说明用该试剂进行普查,准确性只有8.7%.计算表明,如果两次反应为阳性时患 癌症的概率达到了64%.?1.2.6事件的独立性为了计算两个事件同时发生的概率,可以运用乘法定理,P (AB) = P (AB)P (B).什 么情况下P(AB) = P (A)P (B)?即AB同时发生的概率等于两个事件单独发生概率的乘 积?为此我们有如下的定义:定义1.2.7.设A, B是随机试验中的两个事件,若满足P(AB) = P (A)P (B),则称事件A和B相 互独立.关于独立的概念,应该是从实际出发,如果能够判断事件B的发生与否对事件A的 发生与否不产生影响,则事件A, B即为独立.如把一个硬币掷两次,观测正反面出现的 情况,A =第一次出现正面, B =第二次出现正面, AB =两次都出现正面,样本空 间。有4个基本事件,#(AB) = 1, #(A) = 2, #(B) = 2,故P (AB) = 1/4, P (A)P (B) = 1/2 . 1/2 = 1/4即事件A, B相互独立.事实上,我们容易判断第一次是否出现正面与第二次是否出 现正面没有任何影响,即独立的.设i表示事件A发生和不发生之一,八表示事件B发生 和不发生之一.由独立性的定义可以推知P( ",) = P (4)P 5),(这儿一共4个等式).独 立性的定义可以推广到n个事件.定义1.2.8.设Ai, A? , . An是随机试验中的n个事件,以4表示A或4之一.若满足 P (A; A2. An) = P (A;)P (A2). P (A;),则称事件列A1,A2,.An相互独立.(上面有2n个等式)注意:上面等式等价于对Ai, A2 , . . . ArI中的任意k个事件Ail, Ai2, . . . , Aik, k = 2, . . . n, 有P (Ai1 Ai2 . . Aik) = P (Ai1 )P (Ai2 ) . . . P (Aik)注意:独立和不相容是不同的两个概念.例1212. A, B, C三人独立地破译密码,每人能破译密码的概率分别为1/3, 1/4, 1/5 .问 密码能被破译的概率有多大?解:设D=密码被破译,A, B和C分别表示A, B和C三人能破译密码这三个事件,由独 立性,P (D) = P (A n B n C) = 1 - P (4)=1 -P(S)P(H)P(C) = I -=06例1.2.13.在元件可靠性研究中,我们考虑如下两种电路:其中1-4表示4个继电器,它们是否开通是相互独立的,设继电器导通的概率为P,(0 <P<1),求两种电路从L到R为通路的概率.1212解:左图为串联后并联,右边为并联后串联,记Ai =第咋继电器导通,则左图LR为通 路的表达为AA2 n A3A4 ,右图LR为通路的表达为(AI n A3) n (A2 n A4),由于P(AIA2)= P (Ai)P (A2)= P2 = P (A3A4),故P (AiA2 n A3A4) = P2 + P2 - p4 = P2 (2 - P2 )同理,P (Ai n A3) n (A2 n A4) = (2p - p2 )2 = p2 (2 - p)2 ,由于2 - p2 < (2 - p)2 ,故并联后串联的电路比串联后并联的电路的可靠性高一点.例1214 n个人独立向同一目标射击,第i个人命中目标的概率为p, i = 1,2, . . . , n,求至 少有一人命中目标的概率.解:令Ai=第咋人命中目标, D=至少有一人命中目标,则 n n D = Ai ,1-1P(D) = 1 -P(n) = 1 -P(AA2. .An)=1 - (1 Pi )(1 - P2). (1 - P)s 1 - exp - p上面约等号在Pi较小时成立.例如Pi = 0.04, n = 100时,P (D) s 1 - exp-4= 0.98168