数字图像处理基础知识总结.docx

上传人：夺命阿水

文档编号：979773

上传时间：2024-02-20

格式：DOCX

页数：20

大小：74.98KB

《数字图像处理基础知识总结.docx》由会员分享，可在线阅读，更多相关《数字图像处理基础知识总结.docx（20页珍藏版）》请在课桌文档上搜索。

1、第一章数字图像处理概论* 图像是对客观存在对象的一种相似性的、生动性的描述或写真。* 模拟图像空间坐标和明暗程度都是连续变化的、计算机无法直接处理的图像* 数字图像空间坐标和灰度均不连续的、用离散的数字(i般整数)表示的图像(计算机能处理)。是图像的数字表示，像素是其最小的单位。* 数字图像处理(DigitalImageProcessing)利用计算机对数字图像进行(去除噪声、增强、复原、分割、特征提取、识别等)系列操作，从而获得某种预期的结果的技术。(计算机图像处理)* 数字图像处理的特点(优势)(1)处理精度高，再现性好。(2)易于控制处理效果。(3)处理的多样性。(4)图像数据量庞大。(

2、5)图像处理技术综合性强。* 数字图像处理的目的(1)提高图像的视感质量，以到达赏心悦目的目的a.去除图像中的噪声；b改变图像的亮度、颜色；c增强图像中的某些成份、抑制某些成份；d.对图像进行几何变换等，到达艺术效果；(2)提取图像中所包含的某些特征或特殊信息。a.模式识别、计算机视觉的预处理(3)对图像数据进行变换、编码和压缩，以便于图像的存储和传输。* *数字图像处理的主要研究内容(1)图像的数字化a如何将一幅光学图像表示成一组数字，既不失真又便于计算机分析处理(2*)图像的增强a加强图像的有用信息，消弱干扰和噪声图像的恢复a.把退化、模糊了的图像复原。模糊的原因有许多种，最常见的有运动模

3、糊，散焦模糊等(4*)图像的编码a.简化图像的表示，压缩表示图像的数据，以便于存储和传输。(5)图像的重建a.由二维图像重建三维图像(如CT)(6)图像的分析a.对图像中的不同对象进行分割、分类、识别和描述、解释。(7)图像分割与特征提取a图像分割是指将幅图像的区域根据分析对象进行分割。b.图像的特征提取包括了形状特征、纹理特征、颜色特征等。(8)图像隐藏a.是指媒体信息的相互隐藏。b.数字水印。c.图像的信息伪装。(9)图像通信林图像工程的三个层次图像理解(从图像到解释)-图像分析(从图像到数据)图像处理(从图像到图像)1、抽象程度（高一低）2、数据量（小一大）3、语义（高层、中层、低层）4

4、、操作对象（符号、目标、像素）*图像分析：图像分析主要是对图像中感兴趣的目标进行检测和测量，以获得它们的客观信息，从而建立对图像的描述。*图像理解：图像理解的重点是在图像分析的根底上，进一步研究图像中各个目标的性质和他们之间的相互联系，并得出对图像内容含义的理解以及对原来客观场景的解释，从而指导和规划行动。图像处理：【图像输入一一（图像处理增强、复原、编码、压缩等）图像输出）图像识别：【图像输入一一（图像预处理增强、复原）（图像分割）一一（特征提取）一一（图像分类）一一类别、识别结果】图像理解：【图像输入（图像预处理）（图像描述）（图像分析和理解）图像解释】* 数字图像处理的应用领域：通信：图

5、象传输，电视等。宇宙探测：星体图片处理。遥感：地形、地质、矿藏探查，森林、水利、海洋、农业等资源调查，自然灾害预测，环境污染的监测，气象云图。生物医学：CT,X射线成象，B超，红外图象，显微图象。工业生产：产品质量检测，生产过程控制，CAD,CAMo军事：军事目标侦察，制导系统，警戒系统，自动火器控制，反伪装等。公安：现场照片，指纹，手迹，印章，人像等处理和鉴别。档案：过期的文字、图片档案的修复和处理。机器人视觉娱乐：电影特技，动画，广告，MTV等* 数字图像处理的开展动向（1）提高精度，提高处理速度（2）加强软件研究，开发新方法（3）加强边缘学科的研究工作（4）加强理论研究（5）图像处理领域

6、的标准化问题第二章数字图像处理根底* 电磁辐射波：（1）在实际的图像处理应用中，最主要的图像来源于电磁辐射成像。（2）电磁辐射波包括无线电波（Im-100km）s微波（Imm-Im）、红外线（70Onm-Imm）、可见光（40Onm-70Onm）、紫夕卜线（IOnm-40Onm）、X射线（Inm-Ionm）、丫射线（0.00Inm-Inm）O（3）电磁辐射波的波谱范围很广，波长最长的是无线电波为3xl（）2m,其波长是可见光波长的几十亿倍；波长最短的是Y射线，波长为3x10.7,其波长比可见光小几百万倍。* 太阳的电磁辐射波（1）太阳的电磁辐射波恰好主要占据整个可见光谱范围。（2）可见光随波长

7、的不同依次呈现出紫、蓝、绿、黄、橙（橘红）、红六种颜色，白光是由不同颜色的可见光线混合而成的。(3)人从一个物体感受到的颜色是由物体反射的可见光的特性决定的，假设一个物体反射的光在所有可见光波长范围内是平衡的，那么对观察者来说显示的是白色；假设一个物体只反射可见光谱中有限范围的光，那么物体就呈现某种颜色。* 电磁波谱与可见光谱相关概念(1)仅有单一波长成份的光称为单色光，含有两种以上波长成份的光称为复合光，单色光和复合光都是有色彩的光。三基色(红色、绿色、蓝色)，三补色(黄色、品色、青色)。(2)没有色彩的光称为消色光。消色光就是观察者看到的黑白电视的光，所以消色指白色、黑色和各种深浅程度不同

8、的灰色。(3)消色光的属性仅有亮度或强度，通常用灰度级描述这种光的强度。* 简单的图像成像模型-幅图像可定义成一个二维函数f(x,y)由于幅值f实质上反映了图像源的辐射能量，所以f(x,y)一定是非零且有限的，也即有：Of(x,y)AO图像是由于光照射在景物上，并经其反射或透射作用于人眼的结果。所以：f(x,y)可由两个分量来表征，-是照射到观察景物的光的总量，二是景物反射或透射的光的总量.设i(x,y)表示照射到观察景物外表(x,y)处的白光强度，r(x,y)表示观察景物外表(x,y)处的平均反射(或透射)系数，那么有：f(x,y)=i(x,y)r(x,y)其中：0i(x,y)/l”)二维离

9、散傅立叶变换逆变换：/(x,y)=fZF(u,v)e=0v=0*二维离散傅立叶变换的性质：(I)线性性质：助(用y)心(x,y)+Ny+nN)9zn,=0,l,i2F(uyv)F(u+mN,y+HN)(6)共趣对称性：*(x,y)F*(-w-v)(7)卷积定理：f,y)*g(,y)尸(,v)G(w,v)/(,y)g(,y)F(u,v)G(,v)第五章图像增强* 图像增强的应用及其分类图像处理最根本的目的之一是改善图像，而改善图像最常用的技术就是图像增强* 图像增强有两大类应用改善图像的视觉效果，提高图像清晰度突出图像的特征，便于计算机处理。* 图像增强按作用域分为两类，即空域处理和频域处理。*

10、频域处理那么是在图像的某个变换域内，对图像的变换系数进行运算，然后通过逆变换获得图像增强效果。* 领域处理与时域处理的异同：同：都是一种图像处理方法；异：时域处理是根据图像的时间函数对图像的不同时间特进行处理，而频域处理是针对图像的频谱。* 图像增强的点运算对一副输入图像，经点运算将产生一副输出图像，后者的每个像素的灰度值仅由输入像素的值决定。(1)比照度增强(2)比照度拉伸(3)灰度变换* 灰度变换法* *线性灰度变换1、不分段：对于没有灰度层次，模糊不清的图像，可对每个灰度像素进行拉伸2、分段：可用于抑制不感兴趣的图像区域*非线性灰度变换(1)对数变换g(i,)=+电四必11,其中力,c

11、是按需要可以调整的参数。bnc低灰度区扩展，高灰度区压缩。(2)指数变换g(i,j)=Rj-l,其中,c是按需要可以调整的参数。高灰度区扩展，低灰度区压缩。* *直方图(Equalization)表示数字图象中的每灰度级与其出现的频率(该灰度级的象素数目)间的统计关系,用横坐标表示灰度级，纵坐标表示频数(也可用概率表示)* *灰度直方图图像的灰度直方图，是一种表示数字图像中各级灰度值及其出现频数的关系的函数。* *直方图均衡化将原图象的直方图通过变换函数修正为均匀的直方图，然后按均衡直方图修正原图象。* 图象均衡化处理后，图象的直方图是平直的，即各灰度级具有相同的出现频数，那么由于灰度级具有均

12、匀的概率分布，图象看起来就更清晰了。* 直方图均衡化实质上是减少图象的灰度级以换取比照度的加大。* 在均衡过程中，原来的直方图上频数较小的灰度级被归入很少几个或一个灰度级内，故得不到增强。* 假设这些灰度级所构成的图象细节比拟重要，那么需采用局部区域直方图均衡。* *均衡化表格：(例如中从rr7)DX计=B(O)六02)计算(对以计四舍五入，然后与对比)3)确定独4)确定R()(相应的E相加)* *中值滤波法用局部中值代替局部平均值令f(x,y)-原始图象阵列，g(,y)-中值滤波后图象阵列，f(,y)-灰度级，g(x,y)-以f(x,y)为中心的窗口内各象素的灰度中间值。* *中值滤波的特性

13、(1)对离散阶约信号、斜升信号不产生影响(2)连续个数小于窗口长度一半的离散脉冲将被平滑(3)三角函数的顶部平坦化(4)中值滤波后，信号频率谱根本不变(2)优点：1、在平滑脉冲噪声方面非常灵敏，同时可以保护图像锋利的边缘。2、不影响阶跃信号、斜坡信号，连续个数小于窗口长度一半的脉冲受到抑制，三角波信号顶部变平。(3)缺点：1、对于高斯噪声不如均值滤波。2、图像中点、线、尖角等细节较多，那么不宜采用中值滤波。* *均值滤波：(1)优点：把每个像素都用周围的8个像素做均值操作，平滑图像速度快、算法简单。(2)缺点：1、在降低噪声的同时，使图像产生模糊，特别是边缘和细节处，而且模糊尺寸越大，图像模糊

14、程度越大。2、对椒盐噪声的平滑处理效果不理想。林图像的锐化(增强高频分量减少图像模糊)* 目的(1)图像平滑使图像变得模糊(2)图像识别中常常需要突出边缘和轮廓信息。* 方法(1)平均、积分的逆运算，如微分、梯度(2)频谱的角度，高频分量被衰减，加强图像高频分量* 图像的锐化之微分法(1)考察正弦函数sin2派ax,它的微分2派acos2派ax微分后频率不变，幅度上升2派a倍。(2)空间频率愈高，幅度增加就愈大。(3)这说明微分是可以加强高频成分的，从而使图象轮廓变清晰。* 常用的梯度算子(O -(1) Roberts-I 0、0 -b各向同性；对噪声敏感；模板尺寸为偶数，中心位置不明显。Ul

15、0P-1-P(2)Prewitt-101000-10bJ1L引入了平均因素，对噪声有抑制作用；操作简便。Jl 0(3) Sobel -2 01 01) 所有系数之和为零，只保存边缘rO-10、(7)LaPladm增强算子:-15-1、。-1o所有系数之和大于零，保存原图和边缘*几种滤波比照：(依次为：振铃程度、图像模糊程度、噪声平滑效果)ILPF理想低通滤波：严重、严重、最好TLPF梯形低通滤波：较轻、轻、好ELPF指数低通滤波：无、较轻、一般BLPF巴特沃斯(BUtterWorth)低通滤波：无、很轻、-般*几种滤波比照：(1)理想高通滤波有明显的振铃现象，即图像边缘有抖动现象；(2)BUt

16、terWorth高通滤波效果较好，但计算复杂，其优点是有少量低频通过，H(U,v)是渐变的，振铃现象不明显；(3)指数高通效果比BUtterWOrth差些，振铃现象也不明显；(4)梯形高通会产生微振铃效果，但计算简单，故经常采用;* *图像增强的内容：(1)消除噪声，改善图像的视觉效果(2)突出边缘，有利于识别和处理* 频域增强的一般过程：/(x,y)*F(%J嗨u)(,V)idg(x9y)* *频域平滑原理：噪声主要集中在高频局部，为除去噪声改善图像质量，采用低通滤波器抑制高频局部，然后再进行逆变换获得漉波图像，到达平滑图像的目的.采用低通滤波* *同态滤波(1)灰度级动态范围很大，即黑的局

17、部很黑，白的局部很白，而我们感兴趣的图中的某一局部灰度级范围又很小，分不清物体的灰度层次和细节。(2)采用一-般的灰度线形变换是不行的，因为扩展灰度级虽可以提高物理图像的反差，但会使动态范围更大。(3)而压缩灰度级，虽可以减少动态范围，但物理灰度层次和细节就会更看不清。* *(4)同态滤波是一种在频域中将图像亮度范围进行压缩和将图像比照度进行增强的方法。* 同态滤波目的：消除不均匀照度的影响而又不损失图象细节。* 同态滤波依据：f(x,y尸i(x,y)r(x,y)* 同态滤波步骤：(1) z(x,y)=lnf(x,y)=lni(x,y)+lnr(x,y)(2) F(z(x,y)=F(lni(x

18、,y)+F(Inr(X,y),Z(u,v)=I(u,v)+R(u,v)(3)压缩i(x,y)分量的变化范围，削弱I(u,v),增强r(x,y)分量的比照度，提升R(u,v),增强细节。S(u,v)=H(u,v)I(u,v)+H(u,v)R(u,v)(4) i(x,y)=F-1(H(u,v)I(u,v);r(x,y)=F-1(H(u,v)R(u,v)(5) iO(x,y)=exp(iXx,y);rO(x,y)=exp(rx,y);g(x,y)=iO(x,y)rO(x,y)第六章图像复原* *图像退化(为什么要恢复)(1)图像的退化是指图像在形成、传输和记录过程中，由于成像系统、传输介质和设备的不

19、完善，使图像的质量变坏。(2)图像复原就是要尽可能恢复退化图像的本来面目，它是沿图像退化的逆过程进行处理。(3)图像退化的数学模型为：g(x,y)=f(x,y)*h(x,y)+n(x,y),其中g(x,y)为劣化图像，h(x,y)为点扩散函数,n(x,y)为加性噪声。* *典型的图像复原定义：是根据图像退化的先验知识建立一个退化模型，以此模型为根底，采用各种逆退化处理方法进行恢复，得到质量改善的图像。*图像复原过程如下：找退化原因一建立退化模型一反向推演一恢复图像* *图像增强与图像复原的联系与区别？(1)二者的目的都是为了改善图像的质量。(2)图像增强不考虑图像是如何退化的，而是试图采用各种

20、技术来增强图像的视觉效果。因此，图像增强可以不顾增强后的图像是否失真，只要看得舒服就行，偏向于主观判断。(3)而图像复原就完全不同，需知道图像退化的机制和过程等先验知识，据此找出一种相应的逆处理方法，从而得到复原的图像。(4)如果图像已退化，应先作复原处理，再作增强处理。* *点源的概念一幅图像可以看成由无穷多极小的像素所组成，每一个像素都可以看作为一个点源成像，因此，幅图像也可以看成由无穷多点源形成的。* 白噪声：图象平面上不同点的噪声是不相关的，其谱密度为常数。(1)实用上，只要噪声带宽远大于图象带宽，就可把它当作白噪声。虽不精确，确是一个很方便的模型。(2)当噪声与图象不相关时，噪声是加

21、性的。* 采用线性位移不变系统模型的原由：(1)由于许多种退化都可以用线性位移不变模型来近似，这样线性系统中的许多数学工具如线性代数，能用于求解图像复原问题，从而使运算方法简捷和快速。(2)当退化不太严重时，一般用线性位移不变系统模型来复原图像，在很多应用中有较好的复原结果，且计算大为简化。(3)尽管实际非线性和位移可变的情况能更加准确而普遍地反映图像复原问题的本质，但在数学上求解困难。只有在要求很精确的情况下才用位移可变的模型去求解，其求解也常以位移不变的解法为根底加以修改而成。* *逆滤波复原过程：(1)对退化图像g(x,y)作二维离散傅立叶变换，得到G(u,v);(2)计算系统点扩散函数

22、h(x,y)的二维傅立叶变换，得到H(u,v);(3)逆滤波计算F(u,v)=G(u,v)H(u,v)(4)计算F(u,v)的逆傅立叶变换，求得f(x,y)* *逆滤波的病态性：如果考虑噪声项N(x,y),那么出现零点时，噪声项将被放大，零点的影响将会更大，对复原的结果起主导地位，这就是逆滤波的病态性质* *逆滤波的病态性的改良方法：在H(u,v)=O及其附近，人为地仔细设置H-l(u,v)的值，使N(u,v)*Hl(u,v)不会对F(u,v)产生太大影响。* *图像的几何校正(1)图像在获取过程中，由于成像系统本身具有非线性、拍摄角度等因素的影响，会使获得的图像产生几何失真。(2)当对图像作

23、定量分析时，就要对失真的图像先进行精确的几何校正(即将存在几何失真的图像校正成无几何失真的图像*),以免影响定量分析的精度。(3)梯形失真；枕形失真；桶形失真* *几何校正方法：图像几何校正的根本方法是先建立几何校正的数学模型；其次利用条件确定模型参数；最后根据模型对图像进行几何校正。通常分两步：(1)图像空间坐标变换；首先建立图像像点坐标(行、列号)和物方(或参考图)对应点坐标间的映射关系，解求映射关系中的未知参数，然后根据映射关系对图像各个像素坐标进行校正；(2)确定各像素的灰度值(灰度内插)。* 几何校正间接法：由于间接法内插灰度容易，所以一般采用间接法进行几何纠正。(1)设恢复的图像像

24、素在基准坐标系统为等距网格的交叉点，从网格交叉点的坐标f(x,y)出发，假设干点，解求未知数。(2)根据几何变换公式推算出各格网点在畸变图像上的坐标(Xy)。(3)由于(X,y)一般不为整数，不会位于畸变图像像素中心，因而不能直接确定该点的灰度值，(4)只能在畸变图像上，由该像点周围的像素灰度值通过内插，求出该像素的灰度值，作为对应格网点的灰度，据此获得校正图像* 像素灰度内插法:常用的有最近邻元法、双线性内插法和三次内插法三种。第七章图像编码与压缩* 图像编码与压缩的内容(是什么)(1)图像压缩在信息论中称为信源编码(2)图像编码和压缩就是对图像数据按照一定的规那么进行变换和组合，从而以尽可

25、能少的代码表示尽可能多的信息。(3)研究内容包括数据压缩的数据的表示、传输、变换和编码方法，目的是减少存储数据所需的空间和传输所用的时间。*图像编码的根本原理(1)图像数据压缩是可能的(2)一般原始图像中存在很大的冗余度。(3)空间冗余、时间冗余、视觉冗余、信息嫡冗余、结构冗余、知识冗余(4)用户对原始图像的信号不全都感兴趣，可用特征提取和图像识别的方法，丢掉大量无用的信息。提取有用的信息，使必须传输和存储的图像数据大大减少。从信息论观点看，描述图像信源的数据由有用数据和冗余数据两局部组成。林冗余数据有：编码冗余、像素间冗余、心理视觉冗余3种。如果能减少或消除其中的1种或多种冗余，就能取得数据

26、压缩的效果。因此图像信息的压缩是可能的。但到底能压缩多少，除了和图像本身存在的冗余度大小有关外，很大程度取决于对图像质量的要求。原始图像越有规那么，各象素之间的相关性越强，它可能压缩的数据就越多。*图像编码压缩分类(1)根据解压重建后的图像和原始图像之间是否具有误差，图像编码压缩分为无误差(亦称无失真、无损、信息保持)编码和有误差(有失真或有根)编码两大类。【无损编码分为：霍夫曼编码、行程编码、算术编码；有损编码分为：预测编码、变换编码、其它编码。】(2)根据编码作用域划分，图像编码为空间域编码和变换域编码两大类。* 图像保真度描述解码图像相对原始图像偏离程度的测度一般称为保真度。* 最常用的

27、客观保真度准那么：(1)原图像和解码图像之间的均方根误差(2)原图像和解码图像之间的均方根信噪比* *燃：H=-YPiog2Pi(bit)=0* *熠的性质：(1)燧是一个非负数，即总有H(三)大于等于0。(2)当其中一个符号S小j的出现概率p(s小j)=l时,其余符号S小i(i不等于j)的出现概率P(S小i)=0,H(s)=0o(3)当各个S小i出现的概率相同时，那么最大平均信息量为log(底：2)q。(4)嫡值总有H(三)小于等于IOg(底：2)q。* 烯与相关性、冗余度的关系：(1)根据ShannOn无干扰信息保持编码定理，假设对原始图像数据的信息进行信源的无失真图像编码,压缩后平均码率

28、存在一个下限为信源信息燔H。理论上最正确信息保持编码的平均码长可以无限接近信源信息楠H。(2)*原始图像平均码长：方二力(bit)j=0*原始图像冗余度定义为：r=-l0H*编码效率定义为：77=-=1B1+r* 高效码：冗余度接近于0,或编码效率接近于1的编码称为高效码。* 压缩比C定义：C=2,其中表示原始图像的平均比特率，为编码后的平均比特率* *霍夫曼编码：(1)这种编码方法根据源数据符号发生的概率进行编码。在源数据中出现概率越大的符号，相应的码越短；出现概率越小的符号，其码长越长，从而到达用尽可能少的码符号表示源数据。它在变长编码方法中是最正确的。* *霍夫曼编码方法(1)将信源符号

29、按出现概率从大到小排成一列，然后把最末两个符号的概率相加，合成一个概率。(2)把这个符号的概率与其余符号的概率按从大到小排列，然后再把最末两个符号的概率加起来，合成一个概率。(3)重复上述做法，直到最后剩下两个概率为止。(4)从最后一步剩下的两个概率开始逐步向前进行编码。每步只需对两个分支各赋予一个二进制码，如对概率大的赋予码元0,对概率小的赋予码元1,如果相等，那么从中任选一个赋0,另一个赋1。(5)读出时由符号开始一直走到最后的概率和1,将路线上所遇到的。和1反向排序好就是该符号的霍夫曼编码。*算术编码(1)算术编码有两种模式：基于信源概率统计特性的固定编码模式和针对未知信源概率模型的自适

30、应模式。(2)自适应模式中各个符号的概率初始值都相同，它们依据出现的符号而相应地改变。只要编码器和解码器都使用相同的初始值和相同的改变值的方法，那么它们的概率模型将保持一致。(3)有关实验数据说明，在未知信源概率分布的情况下，算术编码一般要优于Huffman编码。在JPEG扩展系统中，就用算术编码取代了哈夫曼编码*算术编码公式：(1) StartN=StartB(即前一项的区间开始值)+LeftC(即该项的区间开始值)*L(即前一项的区间长度)(2) EndN=StartB(即前一项的区间开始值)+RightC(即该项的区间右端值)*L(即前一项的区间长度)(3)将最后的区间化为二进制，去0,

31、把相同局部取出再在末尾加1,即为该数据序列的算术编码。(4)解码(例)：字符串“dacab”的编码是0.1101101,对应的十进制数是0.8516。从编码过程来看，只有当第一个字母为“d”)才会包含编码0.1101101；以此类推，编码器将唯地解出字符串“dacab”*正交变换编码：通过正交变换把图像从空间域转换为能量比拟集中的变换域系数，然后对变换系数进行编码，从而到达缩减比特率的目的。*正交变换的性质*K-L正交变换：(1)运算量：求Cx及其特征值、特征矢量，矩阵运算要N2次实数加法和N2次实数乘法。(2)对视频图像实时处理极难做到。第八章图像分割及特征提取*图像分析：是种通过对图像中不同对象进行分割(把图像分为不同区域或目标物)来对图像中目标进行分类和识别的技术。图像分割：图像分割就是依据图像的灰度、颜色、纹理、边缘等特征，把图像分成各自满足某种相似性准那么或具有某种同质特征的连通区域的集合的过程。*图像分割的依据和方法：(1)图像分割的依据是各区域具有不同的特性，这些特性可以是灰度、颜色、纹理等。而灰度图像分割的依据是基于