第二章-贝叶斯决策理论.docx
《第二章-贝叶斯决策理论.docx》由会员分享,可在线阅读,更多相关《第二章-贝叶斯决策理论.docx(37页珍藏版)》请在课桌文档上搜索。
1、,(1)-NJN.PWNzfN)假设(类)条件概率密度函数P(X1.3i),j=1.,2,用来描述每一类中特征向展的分布情况.如果类条件概率密度函数未知,凰么可以从可用的训练数据中估计出来.贝叶斯判别方法贝叶斯分类猊那么描述为:如果P(P(ftX),那么XG1.如果&助|工)。2|回.那么丫%(211)贝叶斯分类规那么就是看XG四的可能性大,还是XGg的可能性大。P(iIX),/=1,2解件为当样本X出现时,石蛉微率/(他IX)和P(A1.X)的大小从而判别为属于勺或属于2类。三种概率的关系贝叶斯公式:Pgg=03D(2-1-3)P(X)其中.P(X)是X的概率.澎度函数(全概率密度:.它等于
2、所有可能的类概率.密度函数乘以相应的先验概率之和.P(X)=P(XI助)夕他)因为P(X)对于所存的类都是样的,可视为常数因子,它并不影响结果,不考虑“故可栗川下面的写法比拟后脸IK率的大小:p(x)P(P(X1.Q)P(h)那么有XGJ(2-1-4)(I)2二多类的情况 32,”表示样本X所属的个类别. 先龄概率P(姐),=1.2,m假设类条件概率密度函数P(X1.助),1=1,2,小,计算后验概率后,假设:P,IX)P(,IX)vji那么XG3i类.这样的决策可使分类错误率最小.因此叫做拈于最小错误率的贝叶斯决策.R1.和S3的分界点是p(x!)!)=p(x/i)P(i)的交点.R2和R3
3、的分界点是p(x!(2)P)三p(x(w)P(如)的交点.1R*Rif&决策域、决策面,决策面方程和判决函数和分类器决策域、决策面、决策面方程时于物类的分类任芬.按照决策规那么可以把多维特征空间划分成m个决策区域凡叫决策城.两个区域用,R.的边界叫决策面,X是一维时,淡策面是一个点:二维时,决策面是一条曲(三)线;三维时,决策面是一曲(平)面:雉时,决策面是一个切曲(平)面。在数学上用解析形式可以表示为用决黄血方置描述.可符决策面存作有正负的界面,对于任一样本X,代入决策面方程左边的多项式,段设是正的说明xe”,:假设为负说明x幼.判别函数4(x)把描述决策规那么的某种函数叫我别应改d,(x)
4、,例如4(x)=(P(SIX),其中/()是一个单调上升函数。对于最小错误率的情况,可描述为P(1.Ix)-P(WjIx)-O,用判决函数描述决策面方程更方便.分类号分类器可以看成是由软件或硬件组成的一个“分类的机器”,它的功能是先计算出m个判别函数再从中选出判别函数的大位的类作为决策结果.基于量小错误率的判决规那么的其他形式由P(XIe,)P(e)p(XIm)P(公),那么XG1.但这种月决规班么,可写成2,那么有XeHp(x2)J1(x),ji时,xyr;或当Jz(x)=11axP(y,IX)时,xP(ftx),那么有xwi.图2-1-1P(G=P(2x)p(x)dx+PIX)P(XwX=
5、,p(X16)P(y,)1.x+jp(x)P(*:A(*)(1.w2)A(af.cva)::(a4w)(.2)A(4.r,)a(4)这里,“可以等于或大于,大于”,包含了拒绝判决的情况.般,正确的判断要比错误判断的投失小,即以氏,叼)以见,利),亦即44,。条件期望损失RSJx)一(又叫条件风险)对于给定的X的测试(ft.如果采取决第4,4可以在相应行的,个N,.ej当中任取个.这里/=1,2,1.m,相应概率为P(勺).因此在采取决策,情况下的条件期望损失昭,IX)为:mR(a,1.X)=E(a1.,M)=(a1.coj)P(|x),i=1.2.a(2-2-3)?=1 此式是考虑到了某一行中
6、各种请况下的损失的一种加权平均效果即判断XM于?类时相应于决策,的损失函数以各类后验概率为权王的加权和。式中将Jr来自任何一类的情况都考虑到了,同于某一类的可能性越大,P)越大,权由越大。 这里求期不值实际上是求%条件下相对求各类的平均风险。 根据上表,可以计算出。个条件风险R(x).Ria2x).,R(a1.x.期城风险RX是随机向量的测量的,用于X的不同观察值,采取决策a,时.其条件风险的大小是不同的.决策可以看成随机向量X的函数,记为(x),于是我们可以定义期望风险R为:=(r)x)Xx)tZr(2-2-4)式中.公是特征空间的体积元.积分在整个特征空间进行.期里风险R反映对整个特征度间
7、所仃X的取值都采取相应的袂般(x)所带来的平均风险;而条件风险MajX)只是反映了对某X的取值来取决策里所带来的风哙。实际上是对某模式X进行分类判别决策时,算出判断它属于各类的条件期里风险夫(jx),阳%x).,K(ux)之后,判决X周于条件风险的那一类.最小风险贝叶斯决策规那么在考虑描到带来的损失时.我们带望损失最小.如果在采取每一个决策都使其条件风险最小,那么对所有的X作出决策时,其期望风险也必然最小.这样的决策就是最小风险贝H斯决策.最小风险贝叶斯决策班那么为:如果R(aiIx)=nin&勾x),那么有=4(2-2-5).i*1.2w.即在。个条件风险中,选一个最小的,这就是基于最小风险
8、的贝页Wi决策.最小风险贝叶斯决策的步骤(1)在汽叼),p(叼),J=1,2,m,并给出待识别的X的情况下,根据贝叶斯公式可以计算出后验概率:.、P(X!叫)似叫).(xIX)=-1Z,)-1.,2,m(226)p(xIa,)t(a,)SI(2)利用计算出的后段概率及决策表,按式(22-3)计算出采取,.二1.2.”的条件风险R(ai/x).(3)对步MU2)中得刎的。个条件风险值R(x).i1,2.”.进行比拟.找出使条件风险最小的决策见,即R(x)=minR(a1.x).那么aj1.就是最小风险贝叶斯决策,说明应该指出的是,最小风险贝叶斯决策除了要有符合实际情况的先验概率P(1.)及类条件
9、概率密度/Xx.)=0i,j=1,2,m(2-2-7)1.)式中线定时于m类只有=析个决策,即不考虑“拒绝的情况:时于正确决策(即i=力,4(勾,叼)=0,就是没有损失:而对于任何错误决策,其损失均为1.这样定义的损失函数称为01损失函数,此时,条件风险为:EERtaiIX)=(a,.u.(e)+(2(e)-0)式中A是1.agrangc乘子,目的是求r的极小值。从式(21-12)可知:%(,)=IP(XIw)dx,j()=IpxIo2)dx(2210;JiJR1式中.周是类别回的区域:为是类别码的区域,而凡+&=&,人为整个特征空间,也就是说,决策作出之后.俗个特征空间分割成不相交的两个区域
10、2和段.我设样本尸落入冬,就判定属广用类.反之那么随于g类.根据类条件概率密度的性质.仃:pixIco)dx=1-P(HI)dx(2-2-11)JR1.JR1.招式(2-2To)代入式(2-2-9),并顾及到式(2-271),可得:r=1.P(HI)d+Jr(xIcu2)-P(WI1)dj(2-2-12;由此式分别对X和/1求导,令包=O及=0drZ=4S2(xI:)I(xIajdjc=co(2-2-14)满足式(2-2-13)的最正确4值和满足式(2-2T4)的边界面就能使r极小,此时决策规那么可以写为:如果厂黑。,则有工卜2-215)pxI2或,如果(2216)eu2这种限定一类错误率7为
11、行数而使另一类错误率与最小的决策规瑶么就称为聂笠一皮尔透(NeymanPearson)决策规那么。回忆最小错误率贝叶斯决策观那么式(2T-5),将式(2-2T5)与它比照,可以看出聂姓-皮尔逊决策规居么与最小错俣率贝叶斯决策现那么都是以似然比为根底的所不同的只此出小错误率决策所用的Mitf1.是先验概率之比PgIP(A),而娃理皮尔逊决策所用的制值那么是1.agrange乘f2,它是式(2-2T3)和式(2-2-1力方程的解.但是在高维特征空间求解边界面并非易事.这时可利用慨然比密度函数来确定尤值似然比为G(X)=Pa1.叫)/p(xI.似然比密度函数为p(%)求解力=P(IIa2)d1.=C
12、q(2-2-17)由于p(8,那么Pe)1.,因此,采用试探法,对几个不同的尤值计售出鸟(。)后,总UJ以找到一个适宜.的2值,使它刚好能满足鸟修)=埒的条件,兄使小e)尽可能小,仅要得到式(2-2T7)中幺的显式解是不容易的,例1两类二维正态分布模式的均值向增为,w1=(-1.0)r./=(10)r,其秘方非矩阵均为单位矩阵/,即E,=Z=/,其分布如下图2-2-1。现确定=0.0%求聂曼皮尔逊判别道值,因为Mx1.阳)=-cxp-(x-M,1.)r(x-M1)/2J2乃p(x2)=-exp1.-(x,+1.)2+)2cxp-(-f/)z(A-n,)22/r-!-exp-(x1+1.).)2
13、171M工I5)(xI町)所以exp(-24),判别边界为入=exp(-2x)判别式为J与/1之间的关系为0令J,-1yXi=1.n于是,在4取不M数值时,可求得不同的y和却的值,如表2-2-2中所列.2-2-2A4211/21/4y-1.6931.347-i-0.653-0.307*1-0.693-0.34700.3470693、u,河行A1.,21a(2-2-18) 再置定两类区域RI和R2己确定,那么风险R可按式(2-27)=R(a(,x)Ix)pxdx,可写出.R=JR(x)IX)P(X)dx=,R(a,x)p(x)dx+R(a,X)P(X)dx=f)p(xI)+zP(1)p(xI2)
14、tx+1.H1.P(卬MX1.卬+%P(D,)p(x,)fZr我们的目的是要分析风险R1.j先验极率P(M)之间的关系.由于时两类情况.U,()dx=1-Jp(jtI)dxR1.J*2那么式12-2-19)可写为;RInm-奴小化般大风险R(P(O1)=,+(/?,-,)/XX/y,)1.)p(x1.)dx-1.2-n)p(x2)dxR2R1令其=0.可对最小呆大化求解(2-2-21)写成R(P()=+,P(J 由此式说明了,当P(三)变化时,在R1.和&被确定,不说1PQ)做相应时整的情况下.期里风险就是先监概率。(他)的线性函数,即8的“他)呈直线关系,如图皿强所示.其中我们考虑当HeJ变
15、化时的各种可能取值情况下的最正确决策。因为在类概率密度函数,损失函数及某个确定的先验概率P(三)时,利用最小风险贝叶斯决策方法,可以找出两类模式样本的分类决策面,把特征空间分割成R1.和R2两局部,使其风险为显小。所以,可以在(0,D区间内,对先验概率P4)取假设下个不同的值,分别按最小风险贝叶斯决策方法确定其相应的两类边界区域,从而计算出其相应的各个最小风险R-,然后就可以得出股小风险与先验概率P(3)的关系曲线曲P(1.),如下图。注意,这时曲线上各点有若不同的R1.和与边界划分,说明随P(q)变化两类边界在不断做调整,从而得出一些列最小风险。 直线CD在曲线上方并曲线在A点相切,其纵坐标
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 贝叶斯 决策 理论
链接地址:https://www.desk33.com/p-1537474.html