图像被动取证技术简述.docx
《图像被动取证技术简述.docx》由会员分享,可在线阅读,更多相关《图像被动取证技术简述.docx(29页珍藏版)》请在课桌文档上搜索。
1、一、引言过去10年中,数字图像在日常生活中越发流行。和传统文本内容相比,图像更加直观并能传递更多信息。尽管数字图像带来了很多好处,但是它也在一些方面带来了严重的安全问题,即如何检测数字图像的真实性,以及如何发现恶意修改。随着图像处理软件的进步,篡改图片而不留下视觉上可辨的痕迹更加容易,这使得上述问题更具挑战性。为了精确并鲁棒地鉴定图像内容和发现图像造假,研究者已经提出了多种数字图像取证方法。一般而言,这些方法可分为两大类:主动方法和被动方法。主动取证方法通常通过设计各种水印或指纹,并将它们嵌入数字图像。在鉴定阶段,提取先前嵌入的水印或指纹,并用来检测判断原图是否被篡改。如果被篡改,则确定篡改位
2、置在何处。这种主动方法能够精确探测数字图像的篡改,但是这些方法并未被广泛应用。其主要原因在于不可能事先对所有互联网上的图像进行水印处理。因此,更多的人选择被动取证方法。通过分析图像生成/修改阶段所留下的特定线索或模式,能够发现图像造假。和主动取证方法相比,被动取证方法不依赖先验或预设信息,在图像取证领域中应用范围更广。在被动数字图像取证中,多种痕迹被用来区别篡改图像和原始图像。本文中,我们将这些痕迹分为3类:采集痕迹、存储痕迹和编辑痕迹。对每一种痕迹,我们将简要回顾对应的被动数字取证方法,并着重澄清如下问题:这些痕迹是什么?它们如何形成?图像取证中相关的最新方法是什么?为什么这些方法能够探测特
3、定的痕迹?本文的组织如下:第24节,我们逐一介绍被动数字图像取证方法,包括:采集痕迹法、存储痕迹法和编辑痕迹法。第5节讨论当前技术的主要局限,并提出未来可能的研究方向。二、图像采集中的线索数字图像从被捕获到被存储,中间需要经历多个处理步骤(图1)。在进入成像设备之前,光线首先会通过一系列镜头。之后,成像设备将其传送到彩色滤色阵列(ColorfiIterarray,CFA)进行特定的彩色像素排列处理,其仅允许光线的特定成分通过。大多数相机的CFA单元只允许每个像素记录一种颜色的值(红、绿、蓝)。在经过CFA滤波后,光线到达图像传感器一一数码相机的关键部分。目前,有两种广泛使用的传感器:电荷耦合器
4、(chargedcoupleddevice,CCD)和互补金属氧化物半导体(ComPlementarymetal-OXideSemiCOndUCtor,CMOS)。图像传感器中包含大量光敏二极管,每个光敏二极管与图像的像素一一对应。在每个光敏二极管中,经CFA滤色后的光强被转换为电信号。得到的图像数据的每个像素点表示红、绿、蓝中的一种颜色。因此,为了重建全彩图像,需要进行解镶嵌/去马赛克(demosaic)处理,即通过在所有颜色通道上进行插值,重建缺失的色彩分量。图1图像采集流程图上述每个阶段都会在最终图像中引入特定痕迹。这些可以作为图像源识别和篡改检测的线索。以下几个小节简要介绍了镜头阶段、
5、传感器阶段和CFA插值阶段所留下的痕迹,以及利用这些痕迹进行图像取证的典型方法和目前最先进的方法。(一)图像采集阶段的痕迹在采集图像时,镜头的设计和制作工艺使得其无可避免地引入失真/像差。数码相机有两种常见的失真:(chromaticaberration,CA)和球面差(SPheriCalaberration,SA)。不同波长的光线通过透镜时的折射率也各不相同,这种现象称为色差现象;轴上物点发出的光束,经球面折射后不再交于一点,这种现象称为球面像差。传感器模式噪声是图像采集阶段另一种重要特性。在各种传感器噪声中,由光响应不均匀性(photoresponsenonuniformity,PRNU)
6、引起的噪声尤为重要。目前学术界已经提出了多种基于PRNU噪声的数字图像取证方法,涵盖源识别、历史恢复、图像伪造检测等多个领域。PRNU是与成像传感器紧密相关的特性,通过分析图像PRNU可以获得关于成像设备的线索。CFA过程中的解镶嵌/去马赛克操作同样会留下特定痕迹。在色彩重建时,为了获取图像中每个像素的对应值,需要对3个颜色通道进行插值操作。插值过程不可避免地会在像素之间引入一定的关联性,这种相关性可以被看作是成像设备的固有“指纹。通过分析解镶嵌/去马赛克痕迹,可以获得成像设备的线索。(二)利用图像采集痕迹的图像取证1.基于传感器噪声的图像取证利用相机镜头产生的像差,可以将图像与特定设备相关联
7、,或检测图像是否经过篡改。例如,图像中经常出现的径向畸变现象会导致所成图像发生形变。为解决径向失真问题,数码相机制造商通常会采用各种方法来补偿失真,这些方法相应地会产生不同的痕迹。因此,通过分析这些痕迹可以识别相机制造商甚至相机型号。传感器模式噪声通常会被用于图像取证。对于图像/,其对应的传感器噪声可以通过以下公式表述:R=I-F(I)=xP+0(1)式中,R是总体残差,即原始图像减去经过去噪滤波器F滤波后的图像;P是PRNU因子;(P是图像中其他所有噪声的总和。假设我们有同一摄像头捕获的N幅图像I1儿对应的残差Rk可以通过公式(1)得到。PRNU因子P可以通过最大似然估计,按照以下公式进行计
8、算:(2)=E屋Rklk1.)2在相机识别中,假设存在M个设备,则需要计算M次PRNU因子,并且针对每个设备(/=1,2M)记录特定的P,值。在检测阶段,对于待测图像首先通过公式(1)即用,-F计算残余项。然后,PRNU因子与该残差Rt之间的相关性通过以下公式计算:(3)11i=ItPi0Rt式中,弋表归一化互相关;最大值对应的设备即为目标设备。2 .基于CFA痕迹的图像取证基于CFA痕迹的取证方法的基本原理是,原始图像非篡改区域和篡改区域具有不同的CFA模式。因此,对被检测图像的每个分块进行CFA模式计算,如果存在不同的CFA模式,则为篡改图像,并可以得到篡改区域。另外,由于不同的解镶嵌/去
9、马赛克算法会使得同一颜色通道中相邻像素之间的关联性不同,因此基于CFA模式的图像取证可以分为两个方向:预测插值参数并识别成像设备的类型;检查解镶嵌/去马赛克痕迹以找出可能被篡改的区域。(三)最先进的基于采集的图像取证方法1.基于镜头像差的成像设备源识别不同的相机具有不同的镜头像差,因此镜头像差可以作为源识别中设备的固有指纹。Choi等在这方面进行了开创性的工作:鉴于径向畸变会使得直线变弯曲,他们基于像素灰度和畸变程度提出两类特征,从而将成像设备源识别问题转变为二分类问题。与仅使用图像灰度的方法相比,ChOi等的方法实现了4%的检测精度提升。使用镜头痕迹进行图像伪造检测的基本思想是:原始图像和插
10、入的图像块很可能来源于不同的拍摄设备。通过检测不同图像块是否具有同一镜头痕迹,可以鉴别图像是否经过伪造。提出了一种镜头痕迹一一紫边失真(PUrPIefringingaberration,PFA)及相应的提取方法。PFA的方向特性被用作唯一的“指纹来确定被测图像是否具有镜头痕迹不一致性。该算法在图像伪造检测和篡改检测中都取得了很好的效果。3 .基于传感器模式噪声的成像设备源识别由于传感器制造工艺的缺陷,不同像素具有不同的光敏性。因此,传感器噪声(特别是PRNU)可以用来区分各种传感器和相机类型。提出了基于PRNU的源识别方法,可以识别9种相机模型。注意到在边缘区域对传感器噪声的估计不够准确。基于
11、这一发现,他们在特征提取操作之前进行了特定的预处理操作,利用Canny和1.aplace算子进行边缘区域检测,并将检测出的边缘区域移除以做进一步处理。经阈值处理计算得到传感器噪声之后,通过灰度共生矩阵(gray-levelco-occurrencematrix,G1.CM)从离散小波变换(discretewavelettransform,DWT)域提取多个统计特征。最后,采用k-近邻(k-NN)作为分类器对特征进行分类。考虑到手机摄像头识别这一应用场景,提出了一种基于摄像头传感器缺陷的方法。同样从小波域提取特征在手机相机识别中取得了很好的效果。与镜头痕迹类似,传感器噪声可用于检测图像是否经过伪
12、造。其基本想法是,篡改区域中的传感器噪声/指纹会与原始图像不一致,这一线索可以用来定位可疑的篡改区域。Fridrich提出了一种基于PRNU信息的图像篡改检测方法。该方法通过建立统计模型来描述PRNU因子,提取出的PRNU因子同样可以用于成像设备识别。实验结果表明,这种方法在100种不同类型的相机检测中实现了近乎Io0%的准确性。5 .基于CFA痕迹的成像设备源识别如前所述,不同相机的CFA模式和解镶嵌/去马赛克操作会有所差异。Gao等提出了一个基于这些信息的成像设备源识别方法。他们提取出69维的特征来描述上述痕迹。在DreSden图像数据库上的实验结果表明,在7类相机模型的识别中,该方法达到
13、99.88%的准确率。6 .基于CFA痕迹的篡改检测在篡改检测中使用CFA痕迹的基本思想很简单:篡改区域与原始图像会呈现不同的CFA以及解镶嵌/去马赛克痕迹。提出了一种描述图像解镶嵌/去马赛克痕迹的特征。如果存在异常区域(即没有原始图像CFA痕迹或具有与原始图像CFA不同的痕迹),则将其视为篡改区域。提出了一种既能检测图像伪造又能定位篡改区域的方法。通过对解镶嵌/去马赛克造成的痕迹进行建模,实现图像伪造检测。该方法对未压缩图像有很好的检测性能。然而,如何处理JPEG压缩图像仍然是一个具有挑战性的问题。三、存储过程中的线索JPEG(jointphotographicexpertsgroup)是图
14、像传输和存储应用中最广泛使用的图像格式。由于JPEG是一种有损的压缩标准,因此,在图像存储过程中,JPEG将不可避免地引入某些特殊的压缩痕迹。通过分析这些痕迹,研究者可以推导出一些重要的取证线索,例如,该图像被压缩了多少次;图像中的所有区域是否被压缩过相同的次数。在之后的几个小节中,笔者将简要介绍JPEG压缩所留下的特定痕迹、JPEG图像取证的典型场景以及该领域最新的取证方法。(一)JPEG压缩遗留的痕迹针对灰度图像的标准JPEG压缩流程如下(通过在YCbCr色彩空间中的每个通道执行类似的流程,可以将JPEG压缩扩展到彩色图像):首先,对原始图像上进行不重叠的8x8像素块分割;其次,针对每个块
15、,对其灰度值进行2D-DCT变换,从而将该块从空间域变化至频率域;再次,对各频率分量的幅度通过预设的量化表来量化(其中,图2显示了品质因子为50的典型量化表,其中较大的质量因子表示较高的图像质量和较低的压缩比);最后,采用峭编码技术(霍夫曼编码)将量化后的频率幅度转换为二进制序列进行存储。JPEG压缩将对原始图像引入3种误差:量化误差、截断误差和取整误差。量化误差是由频域中的量化过程造成的。量化之后,特定DCT分量的原始值将由最接近的相应量化步长整数倍表示。例如,如果原始DC值为86,量化步长为16(图2),则量化后DC值将变为80,并将差值表示为量化误差(即8680=6)o截断误差和取整误差
16、在逆DCT变换中引入。由于图像每个像素点的灰度值应该是一个从0到255的整数,所以任何大于255或小于0的值都会被截断为255或0,这相应地会导致截断错误。另一方面,逆DCT变换后的大多数值不是整数,并且必须执行取整过程,从而造成取整误差。一般来说,量化误差远大于其他两个误差,特别是当品质因子为中或低(小于75)时。通过分析量化误差,可以推断出关于JPEG压缩的一些线索。16111016244051611212141926586055141316244057695614172229518780621822375668109103772435556481104113924964788710312
17、11201017292959811210010399图2品质因子为50的量化表(二)基于JPEG压缩痕迹的图像篡改检测考虑一个简单的图像篡改场景。我们从图像B中裁剪出一个小块I,并将其插入到图像A中生成一幅合成图像C(图3)。如果使用JPEG压缩存储所有图像A、B和C,则可以观察到以下现象。ImageAImageC图3剪切-粘贴图像篡改示例1.对齐的双JPEG压缩在图像C中,除I之外的所有区域被压缩两次(一次是在存储图像A时,另一次在存储图像C时),并且区域I被压缩了一次。值得一提的是,虽然图像B也被JPEG压缩,但B的88像素点的块分割结构很可能(概率为63/64)与包含区域I的图像A的不同
18、。在这种情况下,基于最终合成图像C的88块分割结构(与图像A的相同),图像C中的区域I仅被压缩一次(在存储图像C时)。因此,可以通过检查所有区域中是否包含对齐的双JPEG压缩区域来定位插入的区域I。在此处,术语对齐是指在前后两次压缩中采用相同的88块分割结构。2 .移位(非对齐)双JPEG(SDJPEG)压缩该种情况主要分析插入区域I,该区域的压缩分块结构本身和插入源图像B完全相同,即先进行了一次对齐JPEG压缩。之后,在合成图像C中,该区域有很大概率(63/64)进行了一次分块结构不一致的JPEG压缩。用于前后压缩的分块结构不一致,因此这种针对插入区域I的压缩痕迹被称为SDJPEG压缩。通过
19、在最终图像C中检测是否包含有移位JPEG痕迹的区域,可以有效地检测图像拼接并定位插入区域I。(三)最先进的双JPEG压缩检测技术对于大多数篡改图像来说,最终图像至少进行了两次JPEG压缩。因此,双JPEG压缩检测是数字图像取证中的关键一环C具有代表性的双JPEG压缩检测方法可参考文献,其中,最早的检测方法之一是由1.UkaS和FridriCh提出的,他们发现双JPEG压缩会在DCT直方图中产生两个峰值,并将其作为检测双重JPEG压缩区域的线索Fu等提出了一个基于广义Benford定律的双JPEG压缩检测方法,并假定JPEG压缩后的DCT系数的第一个数字服从广义Benford定律的分布。进而,违
20、反该假设的任何图像区域被确定为双JPEG压缩区域。PeVny和FridriCh提取了一些低频DCT系数直方图作为检测特征,并使用支持向量机(SVM)作为分类器。Farid指出,如果图像经过了双重JPEG压缩,那么具有相同品质因数的再次压缩会产生最小的重建误差。他将这种最低重建误差的现象称为JPEG鬼影,并试图通过搜索JPEG鬼影来检测双重压缩。1.in等提出了一种基于双JPEG压缩检测的篡改区域定位算法,通过假设单JPEG压缩后的DCT系数遵循拉普拉斯分布来推导双JPEG压缩后的系数分布。随后采用期望最大化(EM)优化算法,预测图像中每个区域被双重压缩的概率。最后通过图切割的算法来避免误报。该
21、算法通常适用于具有不同质量因素的双重压缩。但是,当前后两次压缩使用相同的量化表时,大多数现有方法不能实现高精度检测。鉴于此,HUang等设计了一种算法,针对性地检测具有相同质量因子的双JPEG压缩。他们观察到第一次与第二次JPEG压缩之间的差异往往远小于第二次和第三次JPEG压缩之间的差异,通过引入随机扰动策略进行相应的检测。Yang等扩展了这个想法,并全面分析了品质因子相同的两次JPEG压缩中存在的错误块。着重分析了取整误差和截断误差,并相应提取了描述单次和双重JPEG压缩之间差异的一组特征。通过使用SVM分类器,他们的算法能够在质量因子相对较高的情况下准确检测具有相同品质因子的双重JPEG
22、压缩。当原始图像(即在图3中的图像A)是未压缩图像时,在合成图像中(即在图3中的图像C中)不会存在对齐的双JPEG压缩痕迹。为了在这种情况下检测合成图像,研究人员试图研究SDJPEG压缩效应。1.Uo等通过提出了块伪影特征矩阵(blockingartifactcharacteristicsmatrix,BACM)的特定特征来检测SDJPEG压缩效应。对于单次JPEG压缩图像,相应的BACM是具有对称性的;而对于SDJPEG压缩图像,BACM不再是对称的,进而达到检测SDJPEG压缩的目的。然而,BACM特征在一定程度上与图像内容有关。因此,不同的图像内容可能导致不同类型的BACM特征,这可能会
23、混淆分类器,降低对双重JPEG压缩检测的性能。为了解决与内容相关性的问题,Chen和Hsu提出了一个扩展的BACM特征,并考虑了块间的相关性。QU等提出了一个适用于SDJPEG压缩的卷积混合模型,并采用盲信号分离技术来将双压缩痕迹与图像内容分离。他们提出了一种被称为独立值图(independentvaluemap,IVM)的特征,用于检查整个图像是否经过TSDJPEG压缩(鉴于SDJPEG压缩将打破IVM的对称性)。Bianchi和Piva试图从DCT系数直方图中分析移位JPEG压缩痕迹。为了检测图像中的SDJPEG压缩痕迹,他们对整个图像进行了特定大小区域的全面搜索。当搜索的图像区域与第一次
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 被动 取证 技术 简述

链接地址:https://www.desk33.com/p-1371639.html