石大医学统计学讲义04正态分布及其应用.docx
第四讲正态分布及其应用一、正态分布的概念和特征根据频数表资料绘制成直方图,可以设想,如果将观察人数逐渐增多,线段不断分细,图中直条将逐渐变窄,其顶端将逐渐接近一条光滑的曲线,这条曲线称为频数曲线或频率曲线,略呈钟型,两头低,中间高,左右对称,近似于数学上的正态分布(normaldistribution)o由于频率的总和等于100%或1,故横轴上曲线下的面积等于100%或1。正态分布是一种横重要的连续型分布,在生物统计学中,占有极其重要的地位。许多生物学现象所产生的数据,都服从正态分布。1、正态分布的图形有了正态分布的密度函数f(X),即正态分布的方程,就可给出图形上式中右为均数,o为标准差,X为自变量。当X确定后,就可由此式求得其密度函数f(X),也就是相应的纵坐标的高度。所以,已知和o,就能绘出正态曲线的图形。2、正态分布的特征(1)正态分布以为中心,左右对称。(2)正态分布有两个参数,即和o。是位置参数,当o恒定后,越大,则曲线沿横轴越向右移动;越小,则曲线沿横轴越向左移动。是变异参数,当恒定时,越大,表示数据越分散,曲线越“胖”;越小,表示数据越分散,曲线越“瘦二(3)正态分布的偏斜度=0,峭度2=0为了应用方便,常将上式作如下变换,也就是将原点学到的位置,使横轴尺度以为单位,使=0,=l,则正态分布变换为标准正态分布。(standardnormaldistribution),U称为标准正态离差(standardnormaldeviate)标准正态分布的密度函数为:1-V(u)=-f=e22一般用N(,2)表示均方为,方差为M的正态分布。于是标准正态分布用N(0,1)表示。标准正态分布有以下特征:(1)在U=O时,(u)达到最大值。(2)当U无论向哪个方向远离。时,(u)的值都减小。(3)曲线关于Y轴对称,即(u)=(-u)0(4)曲线和横轴所夹的面积等于1。二、标准正态曲线下面积的计算P(ui<IU|<U2)=(U2)-(Ul)举例已知高梁品种“三尺三”的株高服从正态分布N(156.2,4.822),求:(1)X<161cm的概率;(2)X>161cm的概率;(3)X在152162cm间的概率。(1)依题意:P(X<161)=夕(;:2)=8(1)=0.84134所以,“三尺三”的株高低于161Cm的概率为0.84134。(2)依题意得:164-1562P(X>164)=(482)二1-8。62)=1-0.94738=0.05262(3)依题意得:162-1562P(152<X<162) =82-)-kI;黑=8(1.2)-*(-0.87)=0.88493-0.19215=0.69278下列一些值很重要,应予记忆:面积=0.6827面积=0.9500面积=0.9900U=-I到U=Iu=-1.96到u=1.96u=-2.58到u=2.58三、小结1、正态分布是一种连续性的分布,不少医学现象服从正态分布或近似正态分布(如同性别、同年龄儿童的身高,同性别健康成人的红细胞数、血红蛋白量、脉搏数等,以及实验中的随机误差等);或经变量变换转换为正态分布(如某些病人的潜伏期以及医院病人住院天数等),可按正态分布规律来处理,它也是许多统计方法的理论基础。2、正态分布的特征是:(1)曲线在横轴上方,均数处最高;(2)以均数为中心,左右对称;(3)确定正态分布的两个参数是均数和标准差0正态分布用N(,2)表示,为了应用的方便,常对变量X作u=(x-)使=0,=l,则正态分布转换为标准正态分布用N(0,1)表示。3、运用正态曲线下面积的分布规律,可计算医学参考值范围和质量控制等。