中科大概率论与数理统计讲义02随机变量及其概率分布.docx
《中科大概率论与数理统计讲义02随机变量及其概率分布.docx》由会员分享,可在线阅读,更多相关《中科大概率论与数理统计讲义02随机变量及其概率分布.docx(28页珍藏版)》请在课桌文档上搜索。
1、第二章随机变量及其分布教学目的:1)掌握随机变量的概念。掌握离散型随机变量的概率函数,连续型随机变量的概率密 度,及任意的随机变量的分布函数的概念.2)掌握二项分布、PoiSSOn分布,以及相应的概率计算.3)掌握正态分布,指数分布和均匀分布,会进行相应的概率计算.4)掌握多维随机变量的概念。了解n维随机变量的联合分布函数的概念和性质.5)掌握二维离散型和连续型随机变量的边缘分布与联合分布之间的关系,会用这些关 系式求边缘分布.?2.1随机变量的概念随机变量是其值随机会而定的变量。例2.1.1.以X表示掷一次骰子得到的点数,X是一个随机变量.它可以取1,2, 3, 4, 5, 6中 的一个值,
2、但到底取那个值,要等掷了骰子才知道.例2.1.2. 一张奖券的中奖金额是一个随机变量.它的值要等开奖以后才知道.例2.1.3.在一批产品中随机地抽出100个产品,其中所含的废品数是一个随机变量.它的值要等检查了所有抽出的产品后才知道.在另外的例子中,随机试验的结果虽然不是一个数,但仍可用数来描述.例2.1.4.掷一枚硬币出现正面或反面.例2.1.5.产品被分为正品或废品.上面两例中的结果均可用一个取值0,1的随机变量来描述,其中可以1代表正面或正 品,以。代表反面或废品.事实上,对任意一个事件A,定义,1 e A ,a W)二 0 反之,则事件A由随机变量I裱示出来.IA称为事件A的示性函数.
3、随机变量是把随机试验的结果,也就是样本空间,与一组实数联系起来.这样的处 理简化了原来的概率结构.例如某机构调查民众对一提案的态度是支持还是反对(0) 如果随机访问50人,按照古典概型,所有可能的结果有250个.但是如果我们用X记1的个 数来表示赞成者的人数,则X为一个随机变量.它的取值范围只在0, 1, . . . , 50),所以随 机变量的引进有利于我们对所研究的问题进行准确,简练的描述.又由于随机变量取实 值,随机变量之间的运算就变得容易了.对于随机变量的研究,是概率论的中心内容.因为对于一个随机试验,我们关心的 通常是与所研究的问题有关的某个量或某些量.而这些量就是随机变量.定义令。
4、为一个样本空间.令X是定义在Q上的一个实函数,则称X为一个(一维)随 机变量.常见的随机变量可以分为两大类.只取有限个或可数个值的随机变量称为离散型 随机变量:取连续的值且密度存在的随机变量称为连续型随机变量.当然,存在既非离 散型也非连续型的随机变量.但它们在实际中并不常见,也不是我们这里研究的对象.?2.2离散型随机变量定义22.1.设X为一随机变量.如果X只取有限个或可数个值,则称X为一个(一维)离 散型随机变量.由于一个随机变量的值是由试验结果决定的,因而是以一定的概率取值.这个概率 分布称为离散型随机变量的概率函数.定义2.2.2.设X为一离散型随机变量,其全部可能值为,a2 ,.则
5、Pi=P (X = ai), i = 1,2, .(2.2.1)称为X的概率函数.概率函数pi, i = 1, 2, .必须满足下列条件:p O, i = 1,2 P = 1 .i概率函数(221)指出了全部概率1是如何在X的所有可能值之间分配的.它可以列 表的形式给出:可能值aa2ai.概率PiP2Pi.有时也把(2.2.2)称为随机变量X的分布表.设Q为一样本空间 X为定义于其上的一个离散型随机变量,其取值为N, x2 , .令A 为 , X2 ,的任意一个子集.事件X取值于A中的概率可根据概率的可加性来计算:P (A)= P (X = X).XeA这样知道了离散型随机变量X的概率函数,我
6、们就能给出关于X的任何概率问题的回答.下面我们给出常见的离散型分布.在描述离散概率模型时,BemOuIli试验是最早被 研究且应用及其广泛的概率模型.定义2.2.3.设一个随机试验只有两个可能结果A和i,则称此试验为一Bernoulli试验.定义2.2.4.设将一个可能结果为A和f的BemoUlli试验独立地重复n次,使得事件A每次 出现的概率相同,则称此试验为n重BemoUIH试验.下面的0-1分布和二项分布都是以BemOLlIIi试验为基础的.?2.2.1 01分布设随机变量X只取0,1两值尸(X = 1) = p,p (X = 0) = 1 _ P,则称X服从0-1分布 或BemoUlI
7、i分布. 0-1分布是很多古典概率模型的基础.?2.2.2二项分布设某事件A在一次试验中发生的概率为p.现把试验独立地重复n次.以X记A在这n次试 验中发生的次数,则X取值0, 1,,n ,且有/、P (X = k) =: Pk(I _p)nk, k = 0, 1,. . . , n.(2.2.3)称X服从二项分布,记为XB (n,京.从”/、%k(1 _p)nk =(p+ 1 _p)n = 1,K Bl我们知道(223)确实是一个概率函数.为了考察这个分布是如何产生的,考虑事件X= i要使这个事件发生,必须在 这n次试验的原始记录AA IAIAJ中,有i个A, n _ i个用每个A有概率P而
8、每个H有概率1 _ p,又由于每次试验独立,所以 每次出现A与否与其它次试验的结果独立,因此由概率乘法定理得出每个这样的原始结 果序列发生的概率为Pi(I _ p)n.但是i个A和n 一咋i的排列总数是,所以有i个A的 概率是:/、n pi(1 _p) I = 0, 1,. . , n.一个变量服从二项分布有两个条件:一是各次试验的条件是稳定的,这保证了事 件A的概率P在各次试验中保持不变:二是各次试验的独立性.现实生活中有许多现象 不同程度地满足这些条件.例如工厂每天生产的产品.假设每日生产n个产品.若原材料 质量,机器设备,工人操作水平等在一段时间内保持稳定,且每件产品是否合格与其它 产品
9、合格与否并无显著性关联,则每日的废品数服从二项分布.?2.2.3 POiSSOn 分布设随机变量X的概率分布为P (X = k) = -Le , k = 0, 1,2, . . , 0,(2.2.4)则称X服从参数为的PoiSSOn分布,并记XP ().由于e有级数展开式 - 1 + + ( + . + .w!f0所以P (X = k) = 1.k=0穆德和格雷比尔著的统计学导论给出了PoiSSOn分布的如下推导.假定体积为V的液体包含有一个大数目N的微生物.再假定微生物没有群居的本能, 它们能够在液体的任何部分出现,且在体积相等的部分出现的机会相同.现在我们取体 积为D的微量液体在显微镜下观
10、察,问在这微量液体中将发现X个微生物的概率是什么? 我们假定V远远大于D .由于假定了这些微生物是以一致的概率在液体中到处散布,因 此任何一个微生物在D中出现的概率都是D/V.再由于假定了微生物没有群居的本能, 所以一个微生物在D中的出现,不会影响另一个微生物在D中的出现与否.因此微生物 中有X个在D中出现的概率就是在这里我们还假定微生物是如此之小,拥挤的问题可以忽略不考虑,即N个微生物所占 据的部分对于体积D来说是微不足道.在(225)中令V和N趋向于无穷,且微生物的密度N/V = d保持常数.将(225)式改 写成如下形式:N(N - 1)( .V - 2)- j 4 1) Z .VD x
11、 Z 1 ,VD N X。二。二 J 9、(Dd)X J=x!当N变成无限时其极限为eDd (Dd) x!(2.2.6)令Dd = 很1(2.2.6)和(2.2.4)的形式相同.这一推导过程还证明了是X的平均数,因为所 考察的一部分体积D乘以整个的密度d就给出了在D中所预计的平均数目.当N很大,p很小且NP趋于一个极限时,Poisson分布是二项分布的一个很好的近似. 而在N未知时,Poisson分布更显得有用.我们有下面的定理.定理2.2.1.在n重BemOUni试验中,以Pn代表事件A在试验中出现的概率,它与试验总 数n有关.如果叩n二人,则当n二。时,国(1_pn)n* 二奈(227)
12、例221 .现在需要100个符合规格的元件.从市场上买的该元件有废品率0.01 .考虑到有 废品存在,我们准备买100 + a个元件使得从中可以挑出100个符合规格的元件.我们要求 在这100 + a个元件中至少有100个符合规格的元件的概率不小于0.95 .问a至少要多大?解:令A = 在IOe) + a个元件中至少有IOO个符合规格的元件.假定各元件是否合格是独立的.以X记在100+a个元件中的废品数.则X服从n = 100a 和P = 0.01的二项分布,且P (A) = X 100+ a (0.01)i(0 9)i00ai.(1上式中的概率很难计算.由于100 +a较大而0.01较小,
13、且(I00 + a)(0.01 ) = 1 +0.01as1, 我们以A = 1的PoiSSOn分布来近似上述概率.因而aP (A) = 1 i!.i= 1当a = 0, 1,2, 3时,上式右边分别为0.368, 0.736, 0.920和0.981.故取a = 3已够了.?2.2.4离散的均匀分布设随机变量X取值a, a2,a,且有P (X = ak) = , k = 1, ., n.(2.2.8)H则称X服从离散的均匀分布.可以看出,离散的均匀分布正是古典概型的抽象.?2.3连续型随机变量离散随机变量只取有限个或可数无限个值,而连续型随机变量取不可数个值.这就 决定了不能用描述离散型随机
14、变量的办法来刻划连续型随机变量.考虑一个例子.假定步枪射手瞄准靶子在固定的位置进行一系列的射击.令X是命 中点与过靶心垂线的水平偏离值,设X取值L5cm, 5cm. X是一个连续随机变量.为了计算X落在某区间的概率,将L5, 5分为长为1厘米的小区间.对于每个小区间, 以落在这个小区间的弹孔数除以弹孔总数得到落在这个区间的弹孔的相对频数.设总 弹孔数为100.我们得到下表:区间弹孔数相对频数_5, ,410.01_4, ,310.01L3, _260.06L2,1130.13LtQ240.24O51270.27口,2160.162,370.073,430.034,520.02上表可以用下图来表
15、示:图2.3.1弹孔位点分布图我们注意每个矩形的底等于1 ,高为该矩形的区间所对应的相对频数,所以面积为 相对频数.全部矩形的面积是1 .对于_5, 5的任一子区间,我们可以根据上图估计弹孔 落在该子区间的概率.例如要估计O VXV 2的概率,只要把区间中的两个矩形面积加 起来,结果得到043再譬如说要估计J)25 X 1.5中的概率,我们应当计算该区间上的面积,结果得到:0.06 + 0.27 + 0.08 = 0.41.如果第二批的100颗子弹射在靶子上,我们就将获得另一个经验分布.它与第一个 经验分布多半是不同的,尽管它们的外表可能相似.如果把观察到的相对频数看作为某 一“真”概率的估计
16、,则我们假定有一个函数,它将给出任何区间中的精确概率.这些概 率由曲线下的面积给出.由此我们得到如下定义:定义2.3.1. X称为连续型随机变量,如果存在一个函数f,叫做X的概率密度函数,它 满足下面的条件:1 .对所有的_o X 0;2 . I * * f (x)dx = 1;3 .对于任意的_o a b +o,有P(a X b) = f (x)dx.注 2.3.1.对于任意的_o X +0,有P(X =X)=4 f (u)du = 0.注2.3.2.如果f只取某有限区间a, b的值,令匕、_ f I/) xea,b,(X)= (,其它.则是定义在(_。,+。)上的密度函数,且f (X)和(
17、x)给出相同的概率分布.注2.3.3.假设有总共一个单位的质量连续地分布在a X bj.那么f (x)表示在点X的 质量密度且ICdf(X)dx表示在区间c, d上的全部质量.由于连续随机变量的概率是用积分给出的,我们可以直接处理密度的积分而不是密 度本身.定义2.3.2.设X为一连续型随机变量.则北(2.3.1)F (X) = f (u)du, O X +0称为X的(累积)分布函数.。注2.3.4. F (X)表示的是随机变量的数值小于或等于X的概率,即F (X) = P (X X) _ O X +o.(2.3.2)由式(232)定义的F为X的(累积)分布函数的一般定义.它适用于任意的随机变
18、量.设X为 一离散型随机变量,它以概率曲,p , .取值向,,a ,.则F (X) = pi .a二北分布函数F具有下列性质:F是非减的函数;(2) Iim北/. F (X) = 0;(3) Iim北/+ F(X) = 1.对于连续随机变量,如果F(X)在点X的导数存在,则f() = F0(x).连续随机变量的分布函数的图象如下图所示.下面我们介绍常见的连续型分布.它们包括正态分布,指数分布和均匀分布.?2.3.1 正态分布如果一个随机变量X具有概率密度函数f(x) = ! exp _ . 1 , _o X +o,(2.3.3)*9w2 后其中_o 0 ,则称X为一正态随机变量,记为XN (,
19、 2 ).以(2.3.3)为 密度的分布称为参数为和。2的正态分布.具有参数 = 0,。= 1的正态分布称为标准正态分布.用(x)和(x)表示标准正态分 布N(0, 1)的分布函数和密度函数.从图(233)可以看出,正态分布的密度函数是以X = 为对称轴的对称函数 称为 位置参数.密度函数在X = 处达到最大值,在(_。,)和(, +。)内严格单调.同时我们 看到,。的大小决定了密度函数的陡峭程度.通常称。为正态分布的形状参数.以F(X)记正态分布N(, 2 )的概率分布函数,则恒有F(X) = (气甘).所以任一正态 分布的概率分布函数都可通过标准正态分布的分布函数计算出来.图2.3.2 (
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中科大 概率论 数理统计 讲义 02 随机变量 及其 概率 分布

链接地址:https://www.desk33.com/p-393157.html