数字图像处理基础知识总结.docx
第一章数字图像处理概论* 图像是对客观存在对象的一种相似性的、生动性的描述或写真。* 模拟图像空间坐标和明暗程度都是连续变化的、计算机无法直接处理的图像* 数字图像空间坐标和灰度均不连续的、用离散的数字(i般整数)表示的图像(计算机能处理)。是图像的数字表示,像素是其最小的单位。* 数字图像处理(DigitalImageProcessing)利用计算机对数字图像进行(去除噪声、增强、复原、分割、特征提取、识别等)系列操作,从而获得某种预期的结果的技术。(计算机图像处理)* 数字图像处理的特点(优势)(1)处理精度高,再现性好。(2)易于控制处理效果。(3)处理的多样性。(4)图像数据量庞大。(5)图像处理技术综合性强。* 数字图像处理的目的(1)提高图像的视感质量,以到达赏心悦目的目的a.去除图像中的噪声;b改变图像的亮度、颜色;c增强图像中的某些成份、抑制某些成份;d.对图像进行几何变换等,到达艺术效果;(2)提取图像中所包含的某些特征或特殊信息。a.模式识别、计算机视觉的预处理(3)对图像数据进行变换、编码和压缩,以便于图像的存储和传输。* *数字图像处理的主要研究内容(1)图像的数字化a如何将一幅光学图像表示成一组数字,既不失真又便于计算机分析处理(2*)图像的增强a加强图像的有用信息,消弱干扰和噪声图像的恢复a.把退化、模糊了的图像复原。模糊的原因有许多种,最常见的有运动模糊,散焦模糊等(4*)图像的编码a.简化图像的表示,压缩表示图像的数据,以便于存储和传输。(5)图像的重建a.由二维图像重建三维图像(如CT)(6)图像的分析a.对图像中的不同对象进行分割、分类、识别和描述、解释。(7)图像分割与特征提取a图像分割是指将幅图像的区域根据分析对象进行分割。b.图像的特征提取包括了形状特征、纹理特征、颜色特征等。(8)图像隐藏a.是指媒体信息的相互隐藏。b.数字水印。c.图像的信息伪装。(9)图像通信林图像工程的三个层次图像理解(从图像到解释)-图像分析(从图像到数据)图像处理(从图像到图像)1、抽象程度(高一低)2、数据量(小一大)3、语义(高层、中层、低层)4、操作对象(符号、目标、像素)*图像分析:图像分析主要是对图像中感兴趣的目标进行检测和测量,以获得它们的客观信息,从而建立对图像的描述。*图像理解:图像理解的重点是在图像分析的根底上,进一步研究图像中各个目标的性质和他们之间的相互联系,并得出对图像内容含义的理解以及对原来客观场景的解释,从而指导和规划行动。图像处理:【图像输入一一(图像处理增强、复原、编码、压缩等)图像输出)图像识别:【图像输入一一(图像预处理增强、复原)(图像分割)一一(特征提取)一一(图像分类)一一类别、识别结果】图像理解:【图像输入(图像预处理)(图像描述)(图像分析和理解)图像解释】* 数字图像处理的应用领域:通信:图象传输,电视等。宇宙探测:星体图片处理。遥感:地形、地质、矿藏探查,森林、水利、海洋、农业等资源调查,自然灾害预测,环境污染的监测,气象云图。生物医学:CT,X射线成象,B超,红外图象,显微图象。工业生产:产品质量检测,生产过程控制,CAD,CAMo军事:军事目标侦察,制导系统,警戒系统,自动火器控制,反伪装等。公安:现场照片,指纹,手迹,印章,人像等处理和鉴别。档案:过期的文字、图片档案的修复和处理。机器人视觉娱乐:电影特技,动画,广告,MTV等* 数字图像处理的开展动向(1)提高精度,提高处理速度(2)加强软件研究,开发新方法(3)加强边缘学科的研究工作(4)加强理论研究(5)图像处理领域的标准化问题第二章数字图像处理根底* 电磁辐射波:(1)在实际的图像处理应用中,最主要的图像来源于电磁辐射成像。(2)电磁辐射波包括无线电波(Im-100km)s微波(Imm-Im)、红外线(70Onm-Imm)、可见光(40Onm-70Onm)、紫夕卜线(IOnm-40Onm)、X射线(Inm-Ionm)、丫射线(0.00Inm-Inm)O(3)电磁辐射波的波谱范围很广,波长最长的是无线电波为3xl()2m,其波长是可见光波长的几十亿倍;波长最短的是Y射线,波长为3x10.7,其波长比可见光小几百万倍。* 太阳的电磁辐射波(1)太阳的电磁辐射波恰好主要占据整个可见光谱范围。(2)可见光随波长的不同依次呈现出紫、蓝、绿、黄、橙(橘红)、红六种颜色,白光是由不同颜色的可见光线混合而成的。(3)人从一个物体感受到的颜色是由物体反射的可见光的特性决定的,假设一个物体反射的光在所有可见光波长范围内是平衡的,那么对观察者来说显示的是白色;假设一个物体只反射可见光谱中有限范围的光,那么物体就呈现某种颜色。* 电磁波谱与可见光谱相关概念(1)仅有单一波长成份的光称为单色光,含有两种以上波长成份的光称为复合光,单色光和复合光都是有色彩的光。三基色(红色、绿色、蓝色),三补色(黄色、品色、青色)。(2)没有色彩的光称为消色光。消色光就是观察者看到的黑白电视的光,所以消色指白色、黑色和各种深浅程度不同的灰色。(3)消色光的属性仅有亮度或强度,通常用灰度级描述这种光的强度。* 简单的图像成像模型-幅图像可定义成一个二维函数f(x,y)°由于幅值f实质上反映了图像源的辐射能量,所以f(x,y)一定是非零且有限的,也即有:O<f(x,y)<AO图像是由于光照射在景物上,并经其反射或透射作用于人眼的结果。所以:f(x,y)可由两个分量来表征,-是照射到观察景物的光的总量,二是景物反射或透射的光的总量.设i(x,y)表示照射到观察景物外表(x,y)处的白光强度,r(x,y)表示观察景物外表(x,y)处的平均反射(或透射)系数,那么有:f(x,y)=i(x,y)r(x,y)其中:0<i(x,y)<Al(2.4)0(全吸收)r(x,y)1(全反射)对于消色光图像(有些文献称其为单色光图像),f(,y)表示图像在坐标点(,y)的灰度值1,且:l=f(x,y)(2.5)这种只有灰度属性没有彩色属性的图像称为灰度图像。由式(2.4),显然有:1.minWIWLmaX(2.6)区间.小,LmaX1称为灰度的取值范围。在实际中,一般取Lmin的值为。,这样,灰度的取值范围就可表示成2,Lmax。* 马赫带效应明暗交界处亮处更亮、暗处更暗的现象* 图像的质量评价1、层次:实际的灰度级数2、清晰度:与亮度、比照度、尺寸、细微层次、饱和度等有关3、比照度:最大亮度最小亮度* 数字图像的表示当-幅图像的X和y坐标及幅值f都为连续量时,称该图像为连续图像。为了把连续图像转换成计算机可以接受的数字形式,必须先对连续的图像进行空间和幅值的离散化处理。(1)图像的采样:对图像的连续空间坐标X和y的离散化,必须满足二维采样定理,以确保无失真或有限失真的恢复图像,最大采样间隔由奈奎斯特定理确定;(2)图像灰度级的量化:对图像函数的幅值f的离散化。* 均匀采样:对-幅二维连续图像f(x,y)的连续空间坐标X和y的均匀采样,实质上就是把二维图像平面在X方向和y方向分别进行等间距划分,从而把二维图像平面划分成MXN个网格,并使各网格中心点的位置与用一对实整数表示的笛卡尔坐标(Lj)相对应。二维图像平面上所有网格中心点位置对应的有序实整数对的笛卡尔坐标的全体就构成了该幅图像的采样结果。* 均匀量化:对一幅二维连续图像f(x,y)的幅值f的均匀量化,实质上就是将图像的灰度取值范围O,Lma划分成L个等级(L为正整数,Lmax=LJ),并将二维图像平面上MXN个网格的中心点的灰度值分别量化成与L个等级中最接近的那个等级的值。* 数字图像的表示:为了描述上的方便,本书仍用f(x,y)表示数字图像。设x0,M-l,y0,N-l,f0,L-1,那么数字图像可表示成式(2.7)形式的一个MXN的二维数字阵列。每个(x,y)对应数字图像中的一个根本单元,称其为图像元素(PiCtUreelement),简称为像素(pixel);且一般取M、N和灰度级L为2的整次箱,即:M=2m(2.8)N=2n(2.9)1.=2k(2.10)这里,m、n和k为正整数。存储一幅MXN的数字图像,需要的存储位数为:b=M×N×k(bit)(2.11)字节数为:B=b8(byte)*空间分辨率(1)空间分辨率是图像中可分辨的最小细节,主要由采样间隔值决定。(2*)一种常用的空间分辨率的定义*是单位距离内可分辨的最少黑白线对数目(单位是每毫米线对数),比方每亳米80线对。另外,当简单地把矩形数字化仪的尺寸看作是“单位距离”时,就可把一幅数字图像的阵列大小MXN称为该幅数字图像的空间分辨率。(3)对于一个同样大小的景物来说,对其进行采样的空间分辨率越高,采样间隔就越小,景物中的细节越能更好地在数字化后的图像中反映出来,也即反响该景物的图像的质量就越高。(4)一幅数字图像的阵列大小(简称为图像大小)通常用MXN表示。在景物大小不变的情况下,采样的空间分辨率越高,获得的图像阵列MXN就越大;反之,采样的空间分辨率越低,获得的图像阵列MXN就越小。在空间分辨率不变的情况下,图像阵列MXN越大,图像的尺寸就越大;反之,图像阵列MXN越小,图像的尺寸就越小。*采样数(1、2)、空间分辨率(3)变化对图像视觉效果的影响:(1)在图像的空间分辨率不变(这里指线对宽度不变)的情况下,采样越少,图像越小。(2)在景物大小不变的情况下,图像阵列M*N越小,图像的尺寸越小。(3)随着空间分辨率的降低,图像中的细节信息在逐渐损失,棋盘格似的粗颗粒像素点变得越来越明显。由此也说明,图像的空间分辨率越低,图像的视觉效果越差。* *灰度分辨率灰度级分辨率是指在灰度级别中可分辨的最小变化,通常把灰度级级数L称为图像的灰度级分辨率。* *灰度分辨率变化对图像视觉效果的影响:随着灰度分辨率的降低,图像的细节信息在逐渐损失,伪轮廓信息在逐渐增加。图中由于伪轮廓信息的积累,图像已显现出了木刻画的效果。由此也说明:灰度分辨率越低,图像的视觉效果越差。* *灰度直方图图像的灰度直方图,是种表示数字图像中各级灰度值及其出现频数的关系的函数。设一幅数字图像的灰度级范围为O,L-1,那么该图像的灰度直方图可定义为:h(rk)=nk(r=0,l,2,.,L-l)(2.19)其中,rk表示第k级灰度值,h(rk)和nk表示图像中灰度值为rk的像素个数。* *灰度直方图具有如下一些特征:(1)直方图仅能描述图像中每个灰度级具有的像素个数,不能表示图像中每个像素的位置(空间)信息;(2)任一特定的图像都有惟一的直方图,不同的图像可以具有相同的直方图;(3)对于空间分辨率为MXN,且灰度级范围为0,L-1的图像,有关系:(L-I)求和符(j=0)=MxN(2.20)(4)如果一幅图像由两个不连接的区域组成,那么整幅图像的直方图等于两个不连接的区域的直方图之和。* 灰度直方图的应用1、判断量化是否恰当;2、确定图像二值化阈值;3、计算物体面积;4、计算图像信息量(嫡)HIog2Pii=Q*显示分辨率是指显示屏上能够显示的数字图像的最大像素行数和最大像素列数,取决于显示器上所能够显示的像素点之间的距离。*图像分辨率反映了数字化图像中可分辨的最小细节,也即图像的空间分辨率。在这里将图像分辨率看成是图像阵列的大小。同一显示器(或显示分辨率相同的不同显示器)显示的图像大小只与被显示的图像(阵列)的空间分辨率大小有关,与显示器的显示分辨率无关。换句话说,具有不同空间分辨率的数字图像在同一显示器上的显示分辨率相同。当同一幅图像(或图像分辨率相同的不同图像显示在两个不同显示分辨率的显示器上时,显示的图像的外观尺寸与显示器的显示分辨率有关:显示分辨率越高,显示出的图像的外观尺寸越小;显示分辨率越低,显示出的图像的外观尺寸越大。*光分辨率是指显示系统在每个像素位置产生正确的亮度或光密度的精度,局部地依赖于控制每个像素亮度的比特数。*灰度分辨率是指在灰度级别中可分辨的最小变化,一般把灰度级数L称为数字图像的灰度级分辨率。人眼的视觉过程是一个复杂的过程,可用亮度灰度)、色调和饱和度这三个根本特征量来区分颜色。* 亮度与物体的反射率成正比;* 色调与混合光谱中主要光的波长相联系;* 饱和度与色调的纯度有关。* 位映像是指一个二维的像素阵列。* 位图是指采用位映像方法显示和存储的图像。* *位映像设备是指把位映像形式的二维像素阵列图像,按先行后列的顺序,通过逐像素地重复扫描的方式来显示位图的设备(显示器)。* 常用的图像文件格式有:BMP、GIF、TIFFsPCX、JPEG等。* BMP文件(BitmapFile)是一种WindoWS采用的点阵式图像文件格式。* BMP图像文件的组成:(1)位图文件头(BitmapFileHeader)标识名称:(BrrMAPFlLEHEADER):说明文件的类型和位图数据的起始位置等,共14个字节。(2)位图信息头(BitmapInformationHeader)(BITMAPINFORMATION):说明位图文件的大小、位图的高度和宽度、位图的颜色格式和压缩类型等信息。共40个字节。(3)位图调色板(BitmapPalette)(RGBOUAD:由位图的颜色格式字段所确定的调色板数组,数组中的每个元素是一个RGBQUAD结构,占4个字节。(4)位图数据(Bitm叩Data)(BYTE):位图数据,位图的压缩格式确定了该数据阵列是压缩数据或是非压缩数据。* 图像的位图数据表示的图像共有biWidth×biHeight个像素。* 图像的位图数据是按行存储的,每一行的字节数按照4字节边界对齐,也即每一行的字节数是4的倍数,缺乏的字节用0补齐。* 图像的位图数据是按行从下到上、从左到右排列的。也就是说,从图像的位图数据中最先读到的是图像最下面一行的最左边的像素,最后读到的是图像最上面一行的最右边的一个像素。第三、四章图像变换样图像变换是将图像从空域变换到其它域如频域的数学变换。* 图像变换的目的:(1)使图像处理问题简化(2)有利于图像特征提取(3)有助于从概念上增强对图像信息的理解* 一维正交变换对于一向量f,用上述正交矩阵进行运算:g=Afo假设要恢复f,那么f=A(l)g=A(T)g0以上过程称为正交变换。*傅立叶变换对(傅立叶变换和逆变换)一定存在的条件:当一个一维信号f(x)满足狄里赫利条件,即f(x):(1)具有有限个间断点;(2)具有有限个极值点;(3)绝对可积;那么其傅立叶变换对(傅立叶变换和逆变换)一定存在。*傅立叶(FOUrier)变换的好处:(1)可以得出信号在各个频率点上的强度。(2)可以将卷积运算化为乘积运算。*Fourier变换后的图像,中间局部为低频局部,越靠外边频率越高。*傅立叶(FOurier)变换一维傅立叶变换:+00f(x)为连续可积函数,其傅立叶变换定义为f(x)e-j2uxdx-OD一维傅立叶变换其反变换为:f(x)=Fuej2du一维离散傅立叶变换:1JVT-j2mx正变换公式为:F(U)=-YfMe",m=0,1,2.W-1N=o逆变换为:/(X)=,X=0,l,2.N-l.t=0+00二维傅立叶变换:F(w,v)=f(x,y)e-j2ux+vyjdxdyK0二维傅立叶变换逆变换:f(x,y)=F(,V)S+'Adudv二维离散傅立叶变换:虫»)=£££/(x,y)e"'""MTN-Ij><"/l”)二维离散傅立叶变换逆变换:/(x,y)=fZF(u,v)e""«=0v=0*二维离散傅立叶变换的性质:(I)线性性质:助(用y)±心(x,y)<aFl(w,v)÷aF2(u,v)(2)比例性质:f(,勿)÷÷占尸退,:)abab(-J2(m+啖4)(3)空间位移:f(-Xo,y-%)÷÷尸p2(M+V)(4)平移性质:f(x,y)e'÷÷F(m-m0,v-v0)(5)周期性:f(x,>)+"Ny+nN)9zn,=0,±l,i2F(uyv)÷÷F(u+mN,y+HN)(6)共趣对称性:*(x,y)÷÷F*(-w-v)(7)卷积定理:f,y)*g(,y)尸(,v)G(w,v)/(,y)g(,y)<->F(u,v)G(,v)第五章图像增强* 图像增强的应用及其分类图像处理最根本的目的之一是改善图像,而改善图像最常用的技术就是图像增强* 图像增强有两大类应用改善图像的视觉效果,提高图像清晰度突出图像的特征,便于计算机处理。* 图像增强按作用域分为两类,即空域处理和频域处理。* 频域处理那么是在图像的某个变换域内,对图像的变换系数进行运算,然后通过逆变换获得图像增强效果。* 领域处理与时域处理的异同:同:都是一种图像处理方法;异:时域处理是根据图像的时间函数对图像的不同时间特进行处理,而频域处理是针对图像的频谱。* 图像增强的点运算对一副输入图像,经点运算将产生一副输出图像,后者的每个像素的灰度值仅由输入像素的值决定。(1)比照度增强(2)比照度拉伸(3)灰度变换* 灰度变换法* *线性灰度变换1、不分段:对于没有灰度层次,模糊不清的图像,可对每个灰度像素进行拉伸2、分段:可用于抑制不感兴趣的图像区域*非线性灰度变换(1)对数变换g(i,)=+电四必11,其中力,c是按需要可以调整的参数。bnc低灰度区扩展,高灰度区压缩。(2)指数变换g(i,j)=""Rj-l,其中,c是按需要可以调整的参数。高灰度区扩展,低灰度区压缩。* *直方图(Equalization)表示数字图象中的每灰度级与其出现的频率(该灰度级的象素数目)间的统计关系,用横坐标表示灰度级,纵坐标表示频数(也可用概率表示)* *灰度直方图图像的灰度直方图,是一种表示数字图像中各级灰度值及其出现频数的关系的函数。* *直方图均衡化将原图象的直方图通过变换函数修正为均匀的直方图,然后按均衡直方图修正原图象。* 图象均衡化处理后,图象的直方图是平直的,即各灰度级具有相同的出现频数,那么由于灰度级具有均匀的概率分布,图象看起来就更清晰了。* 直方图均衡化实质上是减少图象的灰度级以换取比照度的加大。* 在均衡过程中,原来的直方图上频数较小的灰度级被归入很少几个或一个灰度级内,故得不到增强。* 假设这些灰度级所构成的图象细节比拟重要,那么需采用局部区域直方图均衡。* *均衡化表格:(例如中从rr7)DX计=£B(O)六02)计算(对以计四舍五入,然后与对比)3)确定独4)确定R()(相应的E相加)* *中值滤波法用局部中值代替局部平均值令f(x,y)-原始图象阵列,g(,y)-中值滤波后图象阵列,f(,y)-灰度级,g(x,y)-以f(x,y)为中心的窗口内各象素的灰度中间值。* *中值滤波的特性(1)对离散阶约信号、斜升信号不产生影响(2)连续个数小于窗口长度一半的离散脉冲将被平滑(3)三角函数的顶部平坦化(4)中值滤波后,信号频率谱根本不变(2)优点:1、在平滑脉冲噪声方面非常灵敏,同时可以保护图像锋利的边缘。2、不影响阶跃信号、斜坡信号,连续个数小于窗口长度一半的脉冲受到抑制,三角波信号顶部变平。(3)缺点:1、对于高斯噪声不如均值滤波。2、图像中点、线、尖角等细节较多,那么不宜采用中值滤波。* *均值滤波:(1)优点:把每个像素都用周围的8个像素做均值操作,平滑图像速度快、算法简单。(2)缺点:1、在降低噪声的同时,使图像产生模糊,特别是边缘和细节处,而且模糊尺寸越大,图像模糊程度越大。2、对椒盐噪声的平滑处理效果不理想。林图像的锐化(增强高频分量减少图像模糊)* 目的(1)图像平滑使图像变得模糊(2)图像识别中常常需要突出边缘和轮廓信息。* 方法(1)平均、积分的逆运算,如微分、梯度(2)频谱的角度,高频分量被衰减,加强图像高频分量* 图像的锐化之微分法(1)考察正弦函数sin2派ax,它的微分2派acos2派ax微分后频率不变,幅度上升2派a倍。(2)空间频率愈高,幅度增加就愈大。(3)这说明微分是可以加强高频成分的,从而使图象轮廓变清晰。* 常用的梯度算子(O -(1) Roberts'-I 0、0 -b各向同性;对噪声敏感;模板尺寸为偶数,中心位置不明显。Ul0P-1-P(2)Prewitt-101000<-10bJ1L引入了平均因素,对噪声有抑制作用;操作简便。Jl 0(3) Sobel -2 01 01) <-1 -2 - 2,000U U 2 1,引入了平均因素,增强了最近像素的影响,噪声抑制效果比PreWitt好。(4)KriSCh噪声抑制作用较好;需求出8个方向的响应(这里只给出2个模板)r-101'八金-1、(5)IsotropicSobel-20近9000-1017J近L权值反比于邻点与中心店的距离,检测沿不用方向边缘时梯度幅度致,即具有各向同性。,0-10、(6)Laplacian算子:-14-1N-1>所有系数之和为零,只保存边缘rO-10、(7)LaPladm增强算子:-15-1、。-1o>所有系数之和大于零,保存原图和边缘*几种滤波比照:(依次为:振铃程度、图像模糊程度、噪声平滑效果)ILPF理想低通滤波:严重、严重、最好TLPF梯形低通滤波:较轻、轻、好ELPF指数低通滤波:无、较轻、一般BLPF巴特沃斯(BUtterWorth)低通滤波:无、很轻、-般*几种滤波比照:(1)理想高通滤波有明显的振铃现象,即图像边缘有抖动现象;(2)BUtterWorth高通滤波效果较好,但计算复杂,其优点是有少量低频通过,H(U,v)是渐变的,振铃现象不明显;(3)指数高通效果比BUtterWOrth差些,振铃现象也不明显;(4)梯形高通会产生微振铃效果,但计算简单,故经常采用;* *图像增强的内容:(1)消除噪声,改善图像的视觉效果(2)突出边缘,有利于识别和处理* 频域增强的一般过程:/(x,y)*F(%J嗨u)"(",V)id>g(x9y)* *频域平滑原理:噪声主要集中在高频局部,为除去噪声改善图像质量,采用低通滤波器抑制高频局部,然后再进行逆变换获得漉波图像,到达平滑图像的目的.采用低通滤波* *同态滤波(1)灰度级动态范围很大,即黑的局部很黑,白的局部很白,而我们感兴趣的图中的某一局部灰度级范围又很小,分不清物体的灰度层次和细节。(2)采用一-般的灰度线形变换是不行的,因为扩展灰度级虽可以提高物理图像的反差,但会使动态范围更大。(3)而压缩灰度级,虽可以减少动态范围,但物理灰度层次和细节就会更看不清。* *(4)同态滤波是一种在频域中将图像亮度范围进行压缩和将图像比照度进行增强的方法。* 同态滤波目的:消除不均匀照度的影响而又不损失图象细节。* 同态滤波依据:f(x,y尸i(x,y)r(x,y)* 同态滤波步骤:(1) z(x,y)=lnf(x,y)=lni(x,y)+lnr(x,y)(2) F(z(x,y)=F(lni(x,y)+F(Inr(X,y),Z(u,v)=I(u,v)+R(u,v)(3)压缩i(x,y)分量的变化范围,削弱I(u,v),增强r(x,y)分量的比照度,提升R(u,v),增强细节。S(u,v)=H(u,v)I(u,v)+H(u,v)R(u,v)(4) i'(x,y)=F-1(H(u,v)I(u,v);r'(x,y)=F-1(H(u,v)R(u,v)(5) iO(x,y)=exp(iXx,y);rO(x,y)=exp(rx,y);g(x,y)=iO(x,y)rO(x,y)第六章图像复原* *图像退化(为什么要恢复)(1)图像的退化是指图像在形成、传输和记录过程中,由于成像系统、传输介质和设备的不完善,使图像的质量变坏。(2)图像复原就是要尽可能恢复退化图像的本来面目,它是沿图像退化的逆过程进行处理。(3)图像退化的数学模型为:g(x,y)=f(x,y)*h(x,y)+n(x,y),其中g(x,y)为劣化图像,h(x,y)为点扩散函数,n(x,y)为加性噪声。* *典型的图像复原定义:是根据图像退化的先验知识建立一个退化模型,以此模型为根底,采用各种逆退化处理方法进行恢复,得到质量改善的图像。*图像复原过程如下:找退化原因一建立退化模型一反向推演一恢复图像* *图像增强与图像复原的联系与区别?(1)二者的目的都是为了改善图像的质量。(2)图像增强不考虑图像是如何退化的,而是试图采用各种技术来增强图像的视觉效果。因此,图像增强可以不顾增强后的图像是否失真,只要看得舒服就行,偏向于主观判断。(3)而图像复原就完全不同,需知道图像退化的机制和过程等先验知识,据此找出一种相应的逆处理方法,从而得到复原的图像。(4)如果图像已退化,应先作复原处理,再作增强处理。* *点源的概念一幅图像可以看成由无穷多极小的像素所组成,每一个像素都可以看作为一个点源成像,因此,幅图像也可以看成由无穷多点源形成的。* 白噪声:图象平面上不同点的噪声是不相关的,其谱密度为常数。(1)实用上,只要噪声带宽远大于图象带宽,就可把它当作白噪声。虽不精确,确是一个很方便的模型。(2)当噪声与图象不相关时,噪声是加性的。* 采用线性位移不变系统模型的原由:(1)由于许多种退化都可以用线性位移不变模型来近似,这样线性系统中的许多数学工具如线性代数,能用于求解图像复原问题,从而使运算方法简捷和快速。(2)当退化不太严重时,一般用线性位移不变系统模型来复原图像,在很多应用中有较好的复原结果,且计算大为简化。(3)尽管实际非线性和位移可变的情况能更加准确而普遍地反映图像复原问题的本质,但在数学上求解困难。只有在要求很精确的情况下才用位移可变的模型去求解,其求解也常以位移不变的解法为根底加以修改而成。* *逆滤波复原过程:(1)对退化图像g(x,y)作二维离散傅立叶变换,得到G(u,v);(2)计算系统点扩散函数h(x,y)的二维傅立叶变换,得到H(u,v);(3)逆滤波计算F(u,v)=G(u,v)H(u,v)(4)计算F(u,v)的逆傅立叶变换,求得f(x,y)* *逆滤波的病态性:如果考虑噪声项N(x,y),那么出现零点时,噪声项将被放大,零点的影响将会更大,对复原的结果起主导地位,这就是逆滤波的病态性质* *逆滤波的病态性的改良方法:在H(u,v)=O及其附近,人为地仔细设置H-l(u,v)的值,使N(u,v)*Hl(u,v)不会对F(u,v)产生太大影响。* *图像的几何校正(1)图像在获取过程中,由于成像系统本身具有非线性、拍摄角度等因素的影响,会使获得的图像产生几何失真。(2)当对图像作定量分析时,就要对失真的图像先进行精确的几何校正(即将存在几何失真的图像校正成无几何失真的图像*),以免影响定量分析的精度。(3)梯形失真;枕形失真;桶形失真* *几何校正方法:图像几何校正的根本方法是先建立几何校正的数学模型;其次利用条件确定模型参数;最后根据模型对图像进行几何校正。通常分两步:(1)图像空间坐标变换;首先建立图像像点坐标(行、列号)和物方(或参考图)对应点坐标间的映射关系,解求映射关系中的未知参数,然后根据映射关系对图像各个像素坐标进行校正;(2)确定各像素的灰度值(灰度内插)。* 几何校正间接法:由于间接法内插灰度容易,所以一般采用间接法进行几何纠正。(1)设恢复的图像像素在基准坐标系统为等距网格的交叉点,从网格交叉点的坐标f(x,y)出发,假设干点,解求未知数。(2)根据几何变换公式推算出各格网点在畸变图像上的坐标(Xy')。(3)由于(X',y')一般不为整数,不会位于畸变图像像素中心,因而不能直接确定该点的灰度值,(4)只能在畸变图像上,由该像点周围的像素灰度值通过内插,求出该像素的灰度值,作为对应格网点的灰度,据此获得校正图像* 像素灰度内插法:常用的有最近邻元法、双线性内插法和三次内插法三种。第七章图像编码与压缩* 图像编码与压缩的内容(是什么)(1)图像压缩在信息论中称为信源编码(2)图像编码和压缩就是对图像数据按照一定的规那么进行变换和组合,从而以尽可能少的代码表示尽可能多的信息。(3)研究内容包括数据压缩的数据的表示、传输、变换和编码方法,目的是减少存储数据所需的空间和传输所用的时间。*图像编码的根本原理(1)图像数据压缩是可能的(2)一般原始图像中存在很大的冗余度。(3)空间冗余、时间冗余、视觉冗余、信息嫡冗余、结构冗余、知识冗余(4)用户对原始图像的信号不全都感兴趣,可用特征提取和图像识别的方法,丢掉大量无用的信息。提取有用的信息,使必须传输和存储的图像数据大大减少。从信息论观点看,描述图像信源的数据由有用数据和冗余数据两局部组成。林冗余数据有:编码冗余、像素间冗余、心理视觉冗余3种。如果能减少或消除其中的1种或多种冗余,就能取得数据压缩的效果。因此图像信息的压缩是可能的。但到底能压缩多少,除了和图像本身存在的冗余度大小有关外,很大程度取决于对图像质量的要求。原始图像越有规那么,各象素之间的相关性越强,它可能压缩的数据就越多。*图像编码压缩分类(1)根据解压重建后的图像和原始图像之间是否具有误差,图像编码压缩分为无误差(亦称无失真、无损、信息保持)编码和有误差(有失真或有根)编码两大类。【无损编码分为:霍夫曼编码、行程编码、算术编码;有损编码分为:预测编码、变换编码、其它编码。】(2)根据编码作用域划分,图像编码为空间域编码和变换域编码两大类。* 图像保真度描述解码图像相对原始图像偏离程度的测度一般称为保真度。* 最常用的客观保真度准那么:(1)原图像和解码图像之间的均方根误差(2)原图像和解码图像之间的均方根信噪比* *燃:H=-YPiog2Pi(bit)=0* *熠的性质:(1)燧是一个非负数,即总有H(三)大于等于0。(2)当其中一个符号S小j的出现概率p(s小j)=l时,其余符号S小i(i不等于j)的出现概率P(S小i)=0,H(s)=0o(3)当各个S小i出现的概率相同时,那么最大平均信息量为log(底:2)q。(4)嫡值总有H(三)小于等于IOg(底:2)q。* 烯与相关性、冗余度的关系:(1)根据ShannOn无干扰信息保持编码定理,假设对原始图像数据的信息进行信源的无失真图像编码,压缩后平均码率存在一个下限为信源信息燔H。理论上最正确信息保持编码的平均码长可以无限接近信源信息楠H。(2)*原始图像平均码长:方二£力£(bit)j=0*原始图像冗余度定义为:r=-l0H*编码效率定义为:77=-=1B1+r* 高效码:冗余度接近于0,或编码效率接近于1的编码称为高效码。* 压缩比C定义:C=2,其中表示原始图像的平均比特率,为编码后的平均比特率* *霍夫曼编码:(1)这种编码方法根据源数据符号发生的概率进行编码。在源数据中出现概率越大的符号,相应的码越短;出现概率越小的符号,其码长越长,从而到达用尽可能少的码符号表示源数据。它在变长编码方法中是最正确的。* *霍夫曼编码方法(1)将信源符号按出现概率从大到小排成一列,然后把最末两个符号的概率相加,合成一个概率。(2)把这个符号的概率与其余符号的概率按从大到小排列,然后再把最末两个符号的概率加起来,合成一个概率。(3)重复上述做法,直到最后剩下两个概率为止。(4)从最后一步剩下的两个概率开始逐步向前进行编码。每步只需对两个分支各赋予一个二进制码,如对概率大的赋予码元0,对概率小的赋予码元1,如果相等,那么从中任选一个赋0,另一个赋1。(5)读出时由符号开始一直走到最后的概率和1,将路线上所遇到的。和1反向排序好就是该符号的霍夫曼编码。*算术编码(1)算术编码有两种模式:基于信源概率统计特性的固定编码模式和针对未知信源概率模型的自适应模式。(2)自适应模式中各个符号的概率初始值都相同,它们依据出现的符号而相应地改变。只要编码器和解码器都使用相同的初始值和相同的改变值的方法,那么它们的概率模型将保持一致。(3)有关实验数据说明,在未知信源概率分布的情况下,算术编码一般要优于Huffman编码。在JPEG扩展系统中,就用算术编码取代了哈夫曼编码*算术编码公式:(1) StartN=StartB(即前一项的区间开始值)+LeftC(即该项的区间开始值)*L(即前一项的区间长度)(2) EndN=StartB(即前一项的区间开始值)+RightC(即该项的区间右端值)*L(即前一项的区间长度)(3)将最后的区间化为二进制,去0,把相同局部取出再在末尾加1,即为该数据序列的算术编码。(4)解码(例):字符串“dacab”的编码是0.1101101,对应的十进制数是0.8516。从编码过程来看,只有当第一个字母为“d”)才会包含编码0.1101101;以此类推,编码器将唯地解出字符串“dacab”*正交变换编码:通过正交变换把图像从空间域转换为能量比拟集中的变换域系数,然后对变换系数进行编码,从而到达缩减比特率的目的。*正交变换的性质*K-L正交变换:(1)运算量:求Cx及其特征值、特征矢量,矩阵运算要N2次实数加法和N2次实数乘法。(2)对视频图像实时处理极难做到。第八章图像分割及特征提取*图像分析:是种通过对图像中不同对象进行分割(把图像分为不同区域或目标物)来对图像中目标进行分类和识别的技术。图像分割:图像分割就是依据图像的灰度、颜色、纹理、边缘等特征,把图像分成各自满足某种相似性准那么或具有某种同质特征的连通区域的集合的过程。*图像分割的依据和方法:(1)图像分割的依据是各区域具有不同的特性,这些特性可以是灰度、颜色、纹理等。而灰度图像分割的依据是基于