用样本估计整体.docx
这就是说。各个小长方形的面积等于相应各组的频率。显然。所有张方形面积之和等于1.为了了解全部产品中优等品所占比例。可以统计出内径尺寸在区间25.325到25.475内的个体数载样本容量中所占的比例、也就是他的频率。从表中容易看出,这个频率值等于012+0.18+025+0.16+013=0.84,于是可以估计出所有生产的钢管中有84%的优等品、工厂可以根据质量标准。看看是否到达优等品率的要求,如果没有到达。就需要进一步分析原因。解决问题。当然。用样本的频率分布估计总体的分布时。要使样本能够很好的反响总体的特征。必须随机抽取样本。由于抽样的随机性,可以想到(参考本届练习A第三题),如果随机抽取另外-个容量为100的样本,所形成的样本频率分布一般会与请按一个样本频率分布有所不同。但是。他们都可以近似的看做总体的分布。从频率分布直方图可以清楚的看出数据分布的总体态势,但是从直方图本身得不出原式的数据内容。所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。把频率分布直方图各个张方形上边的中点用线段连接起来,就得到频率分布折线图,为了方便看图。一般习惯于吧频率分布折线图化成与横轴相连。所以横轴上的左右两端点没有实际的意义。图中各个小长方形的面积,说明了所抽取的100件产品中内径尺寸落在各个小组内的产品个数与100的比值大小。如果样本容量越大,所分组数越多。图中表示的频率分布就越接近于总体在各个小组内取值的个数与总数比值的大小。设想如果样本容量不断增大,分组的组距不断缩小,那么频率分布直方图实际上越来越接近于总体的分布,他可以用仪表光滑取消Y=f(X)来描绘。这条光滑曲线就叫做总体密度曲线。总体密度曲线精确地反映了一个总体在各个区域内取值的规律。产品尺寸落在(a,b)内的百分率就是图中带斜线局部的面积,对本例来说,总体密度曲线呈中间高两边低的“钟”形分布,总体的数据大致呈对称分布,并且大局部数据都集中在靠近中间的区间内。抽样后的样本数据汇总。号可以借助计算机来准确、快速的作出,图就是运用前面所讲到的画直方图的步骤,在工作表中对样本数据汇总得出的结果。茎叶图:某赛季甲乙两名篮球运发动每场比赛的得分情况如下:甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50.乙的得分:8,13,14,16,23,26,28,33,38,39,51.上面的发数据可以用图来表示。他的中间局部像一棵植物的茎,两边局部像这个植物茎上生长出来的叶子。用中间的数字表示两位运发动得分的十位数,两边的数字分别表示两个人各场比赛得分个位数。例如。用3389就表示了33,38,39这三个数据,通常把这样的图焦作茎叶图,根据上图可以对两名运发动的成绩进行比拟。从上面的茎叶图可以看出,甲运发动的得分情况是大致对称的。中位数是36,:乙运发动的得分情况除一个特殊得分外。也大致对称。中位数是26.用茎叶图表示数据有两个突出的优点。一是从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到。二是茎叶图可以在比赛时随时记录。方便记录与表示。用样本的数字特征估计总体的数字特征在日常生活的很多情况下,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征。比方购置灯泡时,消费者希望知道的是这批灯泡的平均使用寿命,我们怎样来了解这批灯泡的平均使用寿命呢?当然不可能把所有的灯泡逐一测试,因为测试后灯泡就报废了。于是,需要通过随机抽样。把这批灯泡的寿命看做整体,从中随机抽取出假设干个个体作为样本,算出样本的数字特征,用样本的数字特征(如平均数等)来估计总体的数字特征。1用样本的平均数估计总体平均数我们在初中学过,平均数描述了数据的平均水平,定量的反响了数据的集中趋势所处的水平,那么,怎样用样本的平均数估计总体的平均数呢?例1:从某大型企业全体员工某月的月工资中随机抽取50名员工的月工资资料如下(单位:元)试计算这50员工的月工资平均数,并估计这个企业的员工平均工资。解月平均工资-800+800+2逆7划元怛月干刁灾5。由此可以估计这家企业的员工月平均工资为1320元。假设你去这家公司应聘职位,月平均工资水平是你考虑的重要因素。一般来讲,月平均工资的水平可以与同类公司待遇进行比拟。同样,再随机抽取50名公司职员的工资。计算说得的样本的平均数般会与例1中的样本平均数不同,所以。用样本平均数估计总体平均数时。样本的平均数只是总体平均数的近似。-x1+x2+xn我们知道,N个样本xl,x2,Xn的平均数,那么有X=X+/+%。也就是把每个'('=1'2J")都用X代替后,数据总和保持不变,所以平均数X对数据有“取齐”的作用,代表了一组数据的数值平均水平。在例1中,可能有人会猜想,应用50%的员工工资超过平均数,而50%低于平均数。我们用前面学习的方法画出例1中月工资的频率分布直方图。并标出样本平均数,又数据可以得出,只有30%的员工月平均工资超过平均数,其余70%的在平均数以下,想一想什么原因导致了这个结果。数据的离散程度可以用极差、方差或标准差来描述。我们知道,样本方差描述了一个数据围绕平均数波动的大小,为了得到以样本数据的单位表示的波动幅度,通常要求求出样本方差的算是平方根,一般的,设样本的元素xl,x2,.xn,样本的平均数为X,定义、其中S的平方表示样本方差。S表示样本标准差。计算样本数据xl,x2,.xn的标准差的算法是:Sl算出样本数据的平均数X:S2算出每个样本数据与样本平均数的差七一Mj=I,2,3,./)S3算出S2中七一x(i=1,2,3,)的平方S4算出S3中N个平方数的平均数,即为样本方差。S5算出S4中平均数的算术平方根,即为样本标准差。例2.计算数据5,7,7,8,10,11的标准差。a-5+7+7+8+10+11o解:SlX=8629+1+1+0+4+9,s=二4S46S5s="=2所以这组数据的标准差为2.例4从甲乙两名学生中选拔一人参加设计比赛,对他们的设计水平进行了测试,两人在相同条件下各射击10次,命中的环数如下:甲:78686591074乙:9578768677(1) 计算甲乙两人你射击命中环数的平均数和标准差:(2) 比拟两个人的成绩,然后决定选择哪一人参赛解:(1)计算得X甲=7%乙=7;SFn=I.73S乙=1.10(2)又(1)可知,甲乙两人的平均成绩相等,但S乙VS甲,这说明乙的成绩比甲的成绩稳定一些,从成绩的稳定性考虑,可以选择乙参加比赛。样本标准差和频率分布直方图有什么关系呢?从标准差的定义可知,如果样本各数据值都相等,那么标准差得0,说明数据没有波动幅度,数据没有离散性。假设个体的值与平均数的差的绝对值较大,那么标准差也较大。说明数据的波动幅度也很大,数据离散程度很高,因此标准差描述了数据对平均数的离散程度。再来看钢管内径尺寸的例子,他的样本平均数为25.401,标本标准差为0.056,在这放图中用虚线i标出平均数所在的位置,并画出距平均数两侧各一倍的标准差和两倍标准差的区间,可以看到大约有70%的钢管内径尺寸落在距离平均数两侧各一倍标准差的区间内,即区间(X-S,X+S),大约有95%的钢管内径尺寸落在距平均数两侧各两倍标准差的区间内,即区间(X-25,x+25),由此我们估计总体中也有大致比率的产品尺寸落入到相应的区间内。实际生产、生活中有大量的例子符合这样的统计规律,比方同一年龄段的人群的身高、体重、同一生产线生产的带装洗衣粉的质量等。变量的相关关系变量与变量之间的关系常见的有两类:一类是确定性的函数关系,像长方形的边长a和面积S的关系。另一类是变量间确实存在关系,但又不具备函数关系所要求确实定性,他们的关系是带有随机性的,例如,人的身高并不能确定体重,但一般来说:“身高者,体也重”,我们说身高与体重这两个变量具有相关关系。怎样判断两个变量有没有相关关系,我们来看下面的例子。例设某地10户家庭的年收入和年饮食支出的统计资料如下表。由表中数据可以看出,y有随X增加而增加的趋势,并且增加的趋势变缓。为了更清楚的看出X与y是否有相关关系,我们以年收入X的取值做横坐标,把年饮食支出y的相应取值作为纵坐标,在直接坐标系中描点(xhyl)(i=l,2,3,,10),如下图,这样的图形叫做散点图,从图中可以只直观的看出家庭年收入和年饮食支出之间具有相关关系,并且当年收入的值由小变大时,年饮食支出的值也在由小变大,这种关系称为正相关,反之,如果一个变量的值由小变大时,另一个变量的值由大变小,这种关系称为负相关。两个变量的线性相关看下面的例子下表是某小卖部六天卖出的热茶的杯数与当天天气温度的比照表。甯)将表中的数据画成散点图;(2) 你能从散点图中发现温度与饮料杯数近似成什么关系吗?(3)如果近似成线性关系的话,请画出一条直线近似地表示这种线性关系解:C)画出的散点图如图(2)从图中可以发现温度和杯数具有相关关系,当温度的值由小到大变化时,杯数的值由大变小,所以温度和杯数成负相关。图中的数据点大致分布在一条直线附近,因此温度和杯数近似成线性相关关系。(3)根据不同的标准,可以画出不同的直线来近似表示这种线性相关关系,比方连接最左侧点和最右侧点得到一条直线,或者让画出的直线上方的点和下方的点数目相等。同学们也可以自己尝试制定标准来画出近似直线,管家能在与这一标准是否合理,是否能够得到最正确的近似直线。(最优拟合直线)。由图2-11可见,所有数据点都分布在一条直线附近,显然这样的直线还可以画出许多条,而我们希望找出其中一条,它能最好的反响X和y之间的关系,换言之,我们要找出一条直线,使这条直线“最贴近”的数据点,几座直线方程为Ay=a+bx这里在y的上方加几号“八”,是为了区分Y的实际值y,表示当X取值xi(i=l,2,3,,6)时,Y相应的观察值为yl,而直线上对应与Xi的纵坐标是:=+加,式叫做Y对X的回归直线方程'°叫做回归系数,要确定回归直线方程,只要确定a与回归系数b。下面我们来研究回归直线方程的求法,设X,Y的一组观察值为(xi,yi)i=l,2,,nA且回归直线方程为y=+bxA当X取值Xi(i=l,2,,n)时,Y的观察值为yi,差'一"刻画了实际观察值yi与回归直线上相应点纵坐标之间的偏高程度,我们希望这n个离差构成的总离差越小越好,才能使所找的直线很贴近点。一个自然的想法是把各个离差加起来作为总离差,可是。由于离差有正有负,直接相加会相互抵消,这样就无法反映这些数据点的贴近程度,即这个总离差不能用n个离差之和£(%-:)来表示,通常是/=I用离差的平方和,即Q二汽(y-。-最)2作为总离差,并使之到达最小,这样,回归直线就是所有直Z=I线中Q取最小值的那一条,由于平方又叫二乘方。所以这种使“离差平方和为最小”的方法,焦作最小二乘法。用最小二乘法求回归直线中的a,b有下面的公式:>fy_-b=-4-®a=y-bx"22xi-nxZ=IA其中a,b的上方加“人”,表示是由观察值按最小二乘法得的估计值,匕也叫回归系数,a,6求出后,回归直线方程就建立起来了。例2在某种产品外表进行腐蚀刻线试验,得到腐蚀深度Y与腐蚀时间X之间相应的一组观察值如下表。(1)画出表中数据的散点图(2)求Y对X的回归直线方程。(结果保存到小数点后3位数字)(3)试预测腐蚀时间为100S时腐蚀深度是多少解:(1)散点图如图(3) 根据公式求腐蚀深度Y对腐蚀时间X的回归直线方程的步骤如下:I先把数据列成表AII计算。,b的值由上表分别计算X,y的平均数得X=*,y=得代入公式得(注意:不必把x,y.化为小数,以减小误差)III写出回归直线方程腐蚀深度Y对腐蚀时间X的回归直线方程为y=0.304x+5.346。这里的回归系数Z?=0.304,他的意义是:腐蚀时间X每增加一个单位(三),深度Y平均增加0.304个单位(um)(3)根据上面求的的回归直线方程,当腐蚀时间为100S时随机现象在自然界和人类社会里,经常会遇到两类不同的现象:必然现象和随机现象。我们能知道。把一块石头抛向空中,他会掉到地面上来,我们生活的地球。每天你都在绕太阳转动,一个人随着岁月的消逝,一定会衰老。死亡这类现象称为必然现象,必然现象是在一定条件下必然发生某种结果的现象。另一类现象称为随机现象,它们具有这样的特点。当在相同的条件下屡次观察同一现象,每次观察到的结果不一定相同,事先很难预料哪一种结果会出现。下面举4个例子。例1我们通常把硬币上刻有国徽的一面称为正面,现在在任意掷一枚质均匀的硬币,那么可能出现“正面朝上”,也可能出现“反面朝上”,究竟得到哪种结果。不可能事先预料到,所以这是一种随机现象。例2一名中学生在篮球场的罚球线练习投篮,对于每次投篮,他可能投进,也可能投不进,即使他打篮球再好,我们最多只能说,他投进的可能性很大。并不能保证每次投篮都能进。所以这也是种随机现象。例3在城市中,当我们走到装有交通信号灯的十字路口时,可能遇到绿灯,这时可以快速穿过马路,也可能遇到红灯或者黄灯,这时就应该停下,一般来说,行人在十字路口看到的交通信号灯颜色,可以认为这是一种S随机现象。例4在10个同类产品中,有8个正品,2个次品,从中任意抽取3个监测,那么,“抽到3个正品”“抽到2个次品”“抽到1个次品”三种结果都有可能出现,至于出现哪种结果,由于是任意抽取,抽取前无法预料,当然这也是一种随机现象。为了探索随机现象的规律性,需要对随机现象进行观察,Women你把观察随机现象或为了某种目的而进行的实验统称为试验,把观察结果或实验结果称为试验的结果,为了讨论问题方便,在本章中我们赋予“试验”这一词比拟广泛的含义,例1中掷硬币,例2的中学生投篮,例3的观察交通信号灯颜色,例4的产品抽样检测等都是试验,此外,像战士打靶。明天会不会下雨,本地的足球队明天会不会进球,甚至小孩在做掷骰子游戏都可以看成试验。事件与根本领件空间当我们在同样的条件下重复进行试验时,有的结果始终不会发生,他成为不可能事件,有的结果在每一次试验中肯定会发生,我们称为必然事件,在试验中可能出现,也可能不出现的结果称为随机事件。如果某个练习投篮的中学生决定投篮5次,那么他“投进6次”称为不可能事件,“他投进的次数小于6”是必然事件,“投进3次”是随机事件。在上一节例4中,也可以列出一些不可能事件,必然事件,随机事件,例如:抽到3个次品是不可能事件,抽到至少一个正品是必然事件,没有抽到正品是随机事件通常用大写英文字母A,BC表示随机事件,随机事件可以简称为事件。为了表达起来文字简洁些,我们又是讲到事件时,其中可能包含不可能事件的和必然事件的意思。一般都不另作说明了。在一次试验中,我们常常要关心的是所有可能发生的根本结果,他们是试验中不能再分最简单的随机事件,其他事件可以用他们来描绘,这样的事件简称为根本领件,所有根本领件构成的集合称为根本领件空间。根本领件空间常用大写希腊字母Q表示。例如,掷一枚硬币,观察硬币落地后那一面向上,这个试验的根本领件空间就是集合正面向上,反面向上,即。=正面向上,反面向上,或简记为Q=(正,反。这个试验有两个根本领件,“正面朝上”和“反面朝上”。掷一枚骰子,观察掷出的点数。这个试验的根本领件空间c=1,2,4,5,6,。其中1,23456,分辨代表骰子掷出的点数为123,4,5,6这六个根本领件。一先一后掷两枚硬币,观察正反面出现的情况,根本领件空间有=(正,正)(正,反)(反,正)(反,反)它有四个根本领件,(正,正)代表第一和第二枚硬币都出现正面。(正,反)代表第一枚硬币是正面,第二枚硬币是反面。(反,正)代表第一枚是反面,第二枚是正面,(反,反)代表第一枚和第二枚都是反面。对于这些问题,除了要知道试验可能出现的每一个结果外,我们还要了解与这些可能出现的结果有关的一些事件,例如,在一先一后掷出两次硬币的试验中,我们要了解“至少又一次出现正面”这个事件,通过观察,我们不能发现“至少又一次出现正面”这个事件可以看成由根本领件(正,正)(正,反)1反,正)组成的集合,假设设事件A=“至少有一次出现正面”,那么,假设掷出了(正,正),显然可以说,“至少有一次出现正面”发生了,或者说事件A发生了;假设掷出了(反,反),就说事件A没有发生。一般的说,如果再一次试验中,出现的结果是集合A中的某个根本领件,我们就说事件A发生了,否那么就说事件A没有发生。我们可以把随机事件理解为根本领件空间的子集。例如,在上面投掷颗骰子观察投掷出点数的试验中,根本领件空间。二1,2,3,456。如果设A=2,46,那么BqC,A也是Q的一个子集。事件B表示“投掷出点数大于4”例1一个盒子中装有10个完全相同的小球,分别标以号码1,2,,10,从中任取一球。观察球的号码,写出这个试验的根本领件和根本领件空间。解:这个试验的根本领件是取得的小球号码为i,i=l,210.根本领件空间1,210)例2连续投掷三枚硬币,观察落地后这三枚硬币出现正面还是反面(1)写出这个试验的根本领件空间。.(2)求这个试验的根本领件的总数。(3)“恰好有两枚正面向上”这一事件包含哪几个根本领件。解:(1)用类似上面一先一后投掷两枚硬币时根本领件的记法,这个试验的根本领件空间Q=(正,正,正)(正,正,反)(正,反,正)(正,反,反)(反,正,正)(反,正,反)(反,反,正)(反,反,反)|;(2)根本领件的总是是8;(3)“恰好有两枚正面向上”包含以下三个根本领件。(正,正,反)(正,反,正)(反,正,正)。频率与概率随机事件在试验中可能发生,自然产生发生的可能性有多大的可能,我们还是从最简单的试验一投掷硬币谈起。虽然我们不能预先判断出出现正面向上还是反面向上,但是假设硬币均匀,直观上可以认为出现正面与反面的时机是相等的。即在大量试验中出现正面的频率应接近于0.5.例1我们一起来投掷硬币把全班分成十几个小组,每个小组45人,各小组把一枚均匀硬币至少投掷100次,观察投掷出正面向上的次数,然后把试验结果及计算结果填入下表小组编号投资次数(n)正面向上次数(m)正面向上频率(mn)当全班做完这一试验后,把试验结果公布在黑板上,请大家谈谈事件“正面朝上”的发生有没有什么规律可循?历史上有些学者还做了成千上万次投掷硬币的试验。我们可以设想有100O个人投掷硬币,如果每个人投掷5次,计算每个人透出正面的频率。在这100O个频率中,一般的说。0,020.4,0.6,0.8,1都会有,而且会有不少是0或1,;如果要求每个人投20次。这是频率为Q0.05,0.95的将会减小,多数频率在0.350.65之间,甚至比拟集中在0.40.6之间;如果要求每个人投掷100O次,这时绝大多数的频率会集中在0.5的附近,和0.5有较大差距的频率值也会有,但这样的频率值会很少,而且随着投掷次数的变多,频率也会越来越明显的集中在0.5附近,当然,即使投掷的次数再多,也不可能排除有和0.5距离较远的频率值,只不过这种情形极少。人们经过大量试验和实际经验的积累逐渐认识到,在屡次重复实验中。同一事件发生的频率在某一个数值附近摆动,而且随着试验次数的增多,一般摆动幅度会很小,而且观察到的大偏差也越少,频率呈现一定的稳定性,频率的稳定性揭示出随机事件发生的可能性有一定的大小,事件的频率稳定在某数值附近,我们就用这一数值表示事件发生的可能性大小。一般地,在n次重复进行的试验中,事件A发生的频率M/N,当n很大时,总是在某个常数附近摆动,随着n的增加,摆动幅度越来越小,这时就把这个常数叫做事件A的概率,记做P(八)。从概率的定义中,我们可以看出随机事件A的概率P(八)满足0P(八)lo这是因为在n次试验中,事件A发生的频数m满足0m<n,所以0岩1,当A时必然事件时,P(八)=1,当A时不可能事件时,P(八)=0.从定义中,我们还可以看出,概率是通过频率来测量的,或者说频率是概率的一个近似,在前述投掷硬币的例子中,经过前人的反复屡次试验,出现真面的频率逐渐稳定到0.5,那么我们就得到出现正面的概率是0.5,这件事情其实质与测量长度一样平常,给定根木棒。谁都不疑心它有“客观”长度,长度是多少?我们可以用尺子或者仪器去测量,不管尺子或者仪器多么精确。测量的额数值总是稳定在木棒真实长度的附近。事实上,人们也是把测量说的的值当做真实值,这个类比有助于我们理解概率和频率之间的内在关系。概率的这种定义叫做概率的统计定义,在实践中很多时候采用这种发法求事件的概率。有了概率的统计定义,我们就可以比拟不同事件发生的可能性大小了。例2为了确定某类种子的发芽率,从一大批种子中抽出假设干批做发芽试验,其结果如下:种子粒数257013070020003000发芽粒数246011663918062713发芽率从以上的数据可以看出,这类种子的发芽率约为0.9.比拟例1和例2的结果,我们可以说,这类种子的发芽率比投资一枚硬币正面向上的概率要大得多。从概率统计定义出发,我们先来考虑此题的简化情形:在投掷一枚均匀硬币的随机试验中,正面出现的概率是0.5,这是否意味着投掷两次硬币一定会出现正面呢?根据经验,我们投掷两次硬币可能一次正面也不出现,即出现两次反面的情形,但是在大量重复投掷硬币的试验中,比方投掷100OO次硬币,那么出现正面的次数约为5000次。买100O张彩票相等于做100o次试验。结果可能一次奖也没中。或者中一次奖,或者屡次中奖,所以“彩票中奖的概率为1/1000”,并不意味着买1000张彩票就一定能中奖,只有当所买彩票的数量N非常大时,我们可以看成大量重复买彩票这个试验,中奖的次数约为nI000比方说买100(X)O(X)张彩票,那么中奖的次数约为100oO0),并且n越大,中奖次数越接近于n/1000。概率的加法公式概率的加法公式是计算概率的一个最根本的公式,根据它可以计算出一些较为复杂事件的概率,我们先通过实例引入两个关于事件的概率:互斥事件与事件的并。例1投掷一枚骰子,观察投掷出的点数,设事件A”出现奇数点”,B为“出现2点”,P(八)=1/2,P(B)=1/6,求“出现奇数点或2点”的概率。这里的事件A和事件B不可能同时发生,这种不可能同时发生的两个事件称为互斥事件,(或称互不相容事件)。设事件C为“出现奇数点或2点”,它也是一个随机事件,事件C与事件A,B的关系是:假设事件A和事件B中至少有一个发生,那么C发生;假设C发生,那么A,B中至少有一个发生,我们称事件C是事件A,B的并。(或和)。一般的,由事件A和B至少一个发生(即A发生或B发生,或A,B都发生)所构成的事件C称为事件A和B的并,记做C=AU5。事件AUB是由事件A或B所包含的根本领件组成的集合。如图,阴影局部所表示的就是AJ假定A,B是互斥事件。在n次试验中,事件A出现的频数是nl,事件B出现的频数是n2,那么事件AJB出现的频数正好是nl+n2,所以事件AUB的频率为:=+而+是事件A出现的频率,詈是事件B出现的频率,因此,如果用以表示在n次试验中事件出现的概率,那么总有<Au8)=A)+%(8).由概率的统计定义。可知P(AD3)=p(八)+p(3)。一般的,如果事件Al,A2,An两两互斥,那么事件“AlUA2u.DA"”发生的概率,等于这n个事件分别发生的概率和,即公式或公式'叫做互斥事件的概率加法公式。例1中事件C:“出现奇数点或者2点”的概率是多件A:“出现奇数点”的概率与事件B:“出现2点”的概率之和,即尸(C)=P(八)+尸(5)=(+看=孝.例2在数学考试中,小明的成绩在90分以上的概率是0.18,。在8089分的概率是0.51,在7079分的概率是015,在6069分的概率是0.09,计算小明在数学考试中取得80分以上的成绩的概率和小明考试及格的概率?解:分别记小明的考试成绩在90分以上,在8089分,在7079分,在6069分为事件B,C,D,E这四个事件是彼此互斥的。根据公式小明的成绩在80分以上的概率是P(BuC)=P(B)+P(C)+0.18+0.51=0.69;小明考试及格的概率,即成绩在60分以上的概率,由公式'P(BuCuDuE)=P(B)+P(C)÷P(D)+P(E)=0.18+0.51+0.15+0.09=0.93。在这个例题中,令A="小明考试及格",A="小明考试不及格”显然两个事件是互斥事件,且必有一个发生,即ADA=Q。像这样不能同时发生且必有一个发生的两个事件焦作互为对立事件,事件A的对立事件记做A,图中阴影局部表示事件A的对立事件,由于a/是互斥事件,所以P(Q)=P(AUa=P(八)+p(Z),又由Q是必然事件得到P(Q)=1,所以,P(八)+P(八)=I,即I-P(八)=P(八)。这个公式为为我们求出P(八)提供了一种方法,当我们直接求P(八)有困难时,常可以转化为PIA)。在例2中,如果求“小明考试不及格”的概率,那么由公式得P(八)=I-P(八)=1-0.93=0.07,即小明考试不及格的概率为0.07.3.2古典概型古典概型前面我们用随机事件的频率来近似概率,对于一些特殊类型的随机试验,我们并不需要去做大量重复的试验就可以得到随机事件的概率。先看下面的例子。1投掷一枚均匀的硬币,观察硬币落地后哪一面朝上,这个试验的根本领件空间。=正,反。它只有两个根本领件,由于硬币的质地是均匀的,因而直观上可以认为出现正面朝上与反面朝上的时机是均等的,所以投掷正面朝上和反面朝上的可能性都是1/2.2投掷骰子,观察出现的点数,这个试验的根本领件空间Q=1,52,3,4,5,6它有六个根本领件,由于骰子的构造是均匀的,因而出现这六个结果的时机是均等的,于是我们可以断言:投掷颗骰子,每种结果出现的可能性都是l6o3-先一后投掷两枚硬币没观察正反面出现的情况,这个试验的根本领件空间。=(正,正)(正,反)(反,正)(反,反),它有四个根本领件,因为每一枚硬币出现正面于出现反面的时机是均等的,所以可以认为这四个根本领件出现的时机是均等的,因而我们说每一个根本领件的可能性都是1/4.以上3个试验有两个共同的特征:(1) 有限性在一次试验中,可能出现的结果只有有限个,即只有有限个不同的根本领件。(2) 等可能性每个根本领件发生的可能性是均等的。我们称这样的试验为古典概型。上述3个例子均为古典概型。一个试验是否为古典概型,在于这个试验是否具有古典概型的两个特征有限性和等可能性,并不是所有的试验都是古典概型。例如,在适应的条件下“种下一粒种子观察它是否发芽“,这个试验的根本领件空间为发芽,不发芽,而发芽或者不发芽这两种结果出现的时机一般式不均等的。又如,从规格直径为300+0.6mm的一批合格产品中任意抽取一根,测量其直径d,测量值可能是从299.4300.6mm之间的任何一个值,所有可能的结果有无限多个,这两个试验都不是古典概型。一般的,对于古典概型,如果试验的n个根本领件为Al,A2,.An,由于根本领件是两两互斥的,那么由互斥时间的概率加法公式得P(A1)+P(A2)+.+P(An)=P(AIDA2j,=P(Q)=I又因为每个根本领件发生的可能性相等,即P(A1)=P(A2)=.=P(An),代入上式得P(1)=1,即P(Al)=In°所以在根本领件总数为n的古典概型中,每个根本领件发生的概率为l11o如果随机事件A包含的根本领件数为m,同样地,由互斥事件的概率加法公式可得P(八)=m/n。所以在古典概型中,P(八)=事件A包含的根本领件数/试验的根本领件总数。这一定义称为概率的古典定义。例1投掷颗骰子,观察掷出的点数,求掷得奇数点的概率。解:这个试验的根本领件空间为c=123,4,5,6O根本领件总数n=6.事件A二掷得奇数点=1,3,5,其中包含的根本领件数m=3,所以P(八)=36=1/2=0.5.例3从含有两件正品al,a2和一件次品bl的3件产品中每次任取1件,每件取中后不放回,连续取两次,求取出的两件产品中恰有一件次品的概率。解:每次取一个,取后不放回地连续取两次,其一切可能的结果组成的根本领件空间为=(al,a2)(al,bl)(a2,bl)(a2,bl)(bl,al)(bl,a2)其中小括号内左边的字母表示第一次取出的产品,右边的字母表示每两次取出的产品。Q由六个根本领件组成,而且可以认为这些根本领件的出现是等可能的,用A表示取出的两件中,恰好有一件次品这一事件,那么A=(ahbl)(a2,bl)(bl,al)(bl,a2)事件A由4个根本领件组成,因而P(八)=46=23o本章小结稳固与提高1判断以下命题的真假:(1) 必然事件的概率等于1;真(2) 某事件的概率等于1.1假(3)互斥事件一定是对立事件。假(4) 对立事件一定是互斥事件真(5) 在适宜条件下种下一粒种子。观察它是否发芽,这个试验是古典概型假2填空(1)掷一颗骰子,出现3点或5点的概率等于:1/3(2)掷两颗骰子,出现点数之和等于8的概率等于:1/6(3)掷三枚硬币,至少出现一个正面的概率等于:7/8(4)掷一颗骰子,A=(点数是奇数,B=点数是偶数,那么AIJB=:点数是1,2,3,456ACB=:0B的互斥事件;点数是奇数A的互斥事件B:点数是偶数(5)P(八)=25,那么P(八)=3/5(6)从至少含有5件次品的10件产品中,任取3件,事件”所取3件都是正品”的对立事件为:事件“所取3件至多有一件正品”的对立事件为3某台,打进的响声时,被接自测与评估1有五条线段,长度分别为135,7,9.从这五条线段中任取3条。求所取三条线段能够成一个三角形的概率。=>=(1,3,5)(1,3,7)(1,3,9)(1,5,9)(1,7,9)1,5,7)3,5,7)(3,5,9)(3,7,9)(5,7,9)根本领件A=(3,5,7)(3,7,9)(5,7,9)P(八)=3102在面积为S的三角形abc的边AB上任取一点P,求三角形PBC的面积大于S/3的概率。因为在AB上任取一点P,并求APBC的面积,所以两个三角形是同底BC的。即BP得高大于AB的1/3时,即概率为2/33把一颗骰子投掷2次,观察出现的点数,并记第一次出现的点数为a,第二次出现的点数为b,试就ax+by=3x+2y=2解答以下问题:(1)求方程组只有一个解的概率(2)求方程组只有正数解得概率。【解】:U,2,-211%="丝y=即匚。=(1,1)(1,2)(1,3)1,4)(1,5)(1,6)2,1)2,2)(2,2a-b2a-b3)2,4)(2,5)(2,6)(3,1)3,2)3,3)(3,4)(3,5)(3,6)4,1)4,2)(4,3)(4,4)(4,5)(4,6)(5,1)(5,2)(5,3)(5(5(5,6)(6,1)(6,2)(6,3)6,4)6,5)(6,6)1:根据以上的方程组要求原题有1解只要让b-2a不等于O就成了那a和b不能出现的情况是(1,2)(2,4)(3,6),用排除法去掉这三种情况概率就是1-(3/36)答案是11/122:要让方程组只有正解,那V的的取值范围就是(0,1),a跟b的关系就是一个不等式组:b-2a>3-2a>0,解得a=1,b=4或5或6,那a和b的组合就只有3种情况,答案就是1/12