视频图像重压缩评价测试指标计算方法、综合评分计算方法和分级原则、测试报告、智能分析模型、主观打分策略.docx
附录A(规范性附录)测试指标计算方法A.1峰值信噪比原始重构帧和重压缩后重构帧直接做差取平方求和,图像高度为H,宽度为W,X(i,j)为原始压缩解码帧坐标(i,j)像素点的灰度值,Y(Ij)为重压缩解码帧坐标(i,j)像素点的灰度值,则均方误差为:HWMSE=击WW(XaJm=7=1峰值信噪比计算公式:峰值信号的能量与噪声的平均能量之比,通常表示的时候取log变成分贝,由于MSE为真实图像与含噪图像之差的能量均值,而两者的差即为噪声,因此PSNR即峰值信号能量与MSE之比。MAXl代表原始重构帧中可能的最大像素值(如果每个像素都由8位二进制来表示,那么就为255),则峰值信噪比为:MAXPSNR=10lo-最终计算的PSNR值是亮度和色度分量的加权值,PSNR=6psrw+psnru+psnrvA.2结构相似度参照参考文献中的计算方法。A.3多尺度结构相似度参照参考文献2中的计算方法。A.4平均偏差相似指数参照参考文献网中的计算方法。A.5视频多方法评估融合可使用NetfliX开源工具进行评测,下载链接见https:A.6目标检测分析偏差PrecisionTP+FPTPReCall=衡量目标检测的准确度的MP指标计算公式,对于每一个类别C,计算方式为:TP+FN其中FN为FalSeNegative(漏报),所有测试集中类别C的漏报数之和;FP为FalSePositive(误报),所有测试集中类别C的误报数之和;TP为TrUePositivee(正报),所有测试集中类别C的正报数之和。对于每一个检测框,输出类别为C,若其满足与类别C真值框的IOU大于设定阈值(一般为0.5),则为TP;若其满足与背景真值框的K)U大于设定阈值,则为FP;若类别C的真值框,没有一个检测框的IOU大于0,则为FN。由于不同置信度阈值下,召回和精度会有所不同,因而可以绘制P-R曲线,得到不同召同率下0,1的精度。然后得至呼-R曲线的面积,则为类别C的AP。对所有类别的AP取均值,则为mAP。由于判断为TPFP还受到IoU的影响,因而不同IOU下也有不同mAP;一般而言,IOU阈值越大,贝IJmAP越低。A.7余弦相似度余弦相似度通过两个向量X和Y在特征空间中的角度来衡量它们之间的相似性,其公式为:SimiIarity=CoS(O)=高Mn其中,Ai,Bi分别代表向量A和B的各分量。余弦相似度的值域为T,1,当向量X和Y完全相同时取到最大值1。附录B(资料性附录)综合评分计算方法和分级原则B.1权重分配在计算综合质量评分时,各维度、各项指标的权重值可参考表B.1、B.2、B.3、B.4o表Bl图像(人眼视觉应用场景)权重列表举例维度指标项指标项权重维度权重客观质革损伤峰值信噪比30%40%结构相似度10%多尺度结构相似度30%视频多方法评估融合30%智能分析偏差100%10%主观质量损伤平均意见分数100%50%表B.2图像(机器视觉应用场景)权重列表举例维度指标项指标项权重维度权重客观质量损伤峰值信噪比30%40%结构相似度10%多尺度结构相似度30%视频多方法评估融合30%智能分析偏差100%50%主观质量损伤平均意见分数100%10%表B.3视频(人眼视觉应用场景)权重列表举例维度指标项指标项权重维度权重客观质量损伤峰值信噪比30%40%结构相似度10%多尺度结构相似度30%视频多方法评估融合30%智能分析偏差100%10%主观质量损伤平均意见分数100%50%表B.4视频(机器视觉应用场景)权重列表举例维度指标项指标项权重维度权重客观质M损伤峰值信噪比30%40%结构相似度10%多尺度结构相似度30%视频多方法评估融合30%智能分析偏差100%50%主观质量损伤平均意见分数100%10%B.2综合质量评分计算方法综合质量评分可参考如下方式:1)综合质量评分=Ek(维戚评分X维度k权重)其中,维度k为客观质量损伤、智能分析偏差、主观质量损伤中的一项。2)客观质量损失维度的计算通过各指标的加权获得,维度A评分二£大指标项j评分X指标项j权重)其中,指标项)为维度k下的指标项。B.3质量损伤分级原则根据综合质量评分,采用五级制的客观评价方法划分视频图像重压缩质量损伤等级,等级越高,表明重压缩质量损伤越小,详见表B.5。表B.5视频图像质量损伤分级级别综合评分说明5级4.5,5无损伤4级3.5,4.5)轻微损伤3级2.5,3.5)有损伤2级1.5,2.5)损伤较严重1级1,1.5)损伤严重附录C(资料性附录)测试报告测试报告形式建表C.1。C.1视频图像重压缩测试报告序号测试项目测试结果评分结果备注1峰值信噪比2结构相似度3多尺度结构相似度4视频多方法评估融合5目标检测偏差6目标识别偏差7主观评价平均分重压缩视频图像损伤等级按人眼视觉和机器视觉的应用场景分别提供损伤等级说明压缩率附录D(资料性附录)智能分析模型智能分析模型列举如下:1、目标检测模型:YoIoX链接:文献:Y0L0X:ExceedingYOLOSeriesin2021,ZhengGe1SOngtaoLiu,https:/arxiv.org/pdf/2107.08430.pdf2、目标检测模型:YOIOV5链接:Checkpoint:https:/github.eom/ultralytics/yolov5#pretrained-checkpointsyolov5l.pt3、车辆识别模型:HRCN1链接:文献:Heterogeneousrelationalcomplementforvehiclere-identification4、车牌识别模型:HyperLPR链接:https:/5、人脸识别模型:FaceNet链接:Checkpoint:pytorchreleasesdownloadv2.2.920180402-114759-vggface2.pt参考文献:SchroffF.KalenichenkoD1PhilbinJ.Facenet:AunifiedembeddingforfacerecognitionandclsterigCProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition.2015:815-823.6、人体识别模型:AGW-reset50链接:reid/releases/download/v0.1.1/msmt_agw_R50.pth;文献:DeepLearningforPersonRe-identification:ASurveyandOutlook7、.行人重识别模型:OSNet链接:Checkpoint:https:/drive.google.eom/file/d/lLaGlEJpHrxdAxKnSCJJ0u-nbxSAeiFY/View?USP=Sharing文献:ZhouK1YangY,CavallaroA.etal.0mi-scalefeaturelearningforpersonre-identificatioCProceedigsoftheIEEECVFInternationalConferenceonComputerVision.2019:3702-3712.附录E(资料性附录)主观打分策略智能分析目标对象和画面整体评价的主观打分策略如表E.1。表E.1主观打分策略表打分项目打分策略MoS分人脸目标人脸目标没有模糊,识别结果完全一致5分车牌目标车牌目标没有模糊,识别结果完全一致车身目标车身目标没有模糊,识别结果完全一致人体目标人体目标没有模糊,识别结果完全一致智能分析目标对象取以上四项的最小值,为5分画面整体评价略有模糊,无伪影现象人脸目标人脸目标略有模糊,但没有五官不清晰4分车牌目标车牌目标略有模糊,但识别准确车身目标车身目标略有模糊,但识别准确人体目标人体目标略有模糊,但没有轮廓不清晰智能分析目标对象取以上四项的最小值,为4分画面整体评价略有模糊.有少量细节上的模糊人脸目标人脸目标略有模糊,有至多一个五官处在可清晰识别的边缘3分车牌目标车牌目标略有模糊.有至多一个字符处在可清晰识别的边缘车身目标车身目标略有模糊,但对识别影响较小人体目标人体目标略有模糊,有部分衣物、轮廓属于看清的边缘智能分析目标对象取以上四项的最小值,为3分画面整体评价略有模糊,存在多处细节上的模糊,没有大块的失真人脸目标人脸目标有明显模糊,有多个五官不能清晰识别,但整体轮廓清晰2分车牌目标车牌目标有明显模糊,多个字符模糊车身目标车身目标有明显模糊,有轮廓模糊人体目标人体目标有明显模糊,有轮廓、衣物等模糊智能分析目标对象取以上四项的最小值,为2分画面整体评价有较多模糊,但不影响场景位置的判断人脸目标人脸目标有明显模糊,且整体轮廓模糊,完全无法识别1分车牌目标车牌目标有明显模糊.完全无法正确识别车身目标车身目标有明显模糊,轮廓大面积失真人体目标人体目标有明显模糊,轮廓、衣物等大面积失真智能分析目标对象取以上四项的最小值,为1分画面整体评价有明显模糊,大面积失真,难以分辨具体位置