输电工程卫星遥感目标识别准确度评价指标及计算、空间抽样模型、抽样算例、分类产品真实性检验报告样例.docx
附录A(资料性附录)准确度评价指标及计算方法A.1误差矩阵errormatrix分类精度评价的一种标准形式,是一个用于表示分类某一类别的像元个数与地面检验为该类别数的比较阵列,如表A.1。表A.1误差矩阵表实测数据类型分类数据类型实测总和12ik1Tinn21WfclP+2n12n22ni2以2P+2jnUn2JnUnkjP+jklk九2niknkkP+k分类总和Pi+P2+Pi+Pk+Pk代表类别的数量,P为样本总数,ZIij为遥感分类中为i类而参考类别中属于/类的样本数目,Pi+为分类所得到的第i类的总和,p+j为实际观测的第/类的总和。A.2总体分类精度OVeraHaccuracy表示对每一个随机样本,所分类的结果与地面所对应区域的实际类型相一致的概率,符号为P,由式(A.1)表示:(A.1)A.3Kappa系数Kappacoefficient测定两幅图之间吻合度与精度的指标,符号为除砒,由式(A.2)表示:(A. 2)_Pi=1nii-1(Pi+p+i)hat=P2-Jl1(Pi+P+i)附录B(资料性附录)空间抽样模型8.1 简单随机抽样模型B.L1模型介绍简单随机抽样根据调查对象总体的变异程度、用户定义的抽样误差计算样本量,再根据样本量从总体中随机抽取样本。样本值调查以后,按照A.l,A.2和A.3进行准确度评价。B.1.2样本量计算影像识别分类产品作为一个总体,样本量可用公式(B.1)计算。(B. 1)Z新P(I-P)d2Iz打PU-P)N式中各字母意义见表表B.L1计算识别分类遥感产品样本量需要的参数参数名称字母表示释义总体N待检产品的全部像元总体方差S2每个类别占总体比率的方差即成数方差S2=P(I-P),P为样本成数。由于总体的变异程度很难估计,通常取P=0.5,即假定总体有最大的变异程度,此时方差达到最大,样本容量较为保守。置信水平1a用户根据抽样的可靠性性需求确定显著性水平a用户根据抽样的可靠性性需求确定置信水平1-a对应的标准正态分布双侧分位数Z2根据抽样的显著性水平和标准正态分布分位数表确定可接受的绝对误差d用户可接受的样本均值估算的绝对误差,抽样前需要参考每个分类占总体的百分比确定该值。例如,对于某个占总体比例的4%类别,则期望的样本均值估算的绝对误差需要显著小于4%,如取值为0.01,相当于增加样本量降低绝对误差。8.2 分层随机抽样8.2.1 模型介绍在识别分类总体N中,令L为类别的数量,则各个类别将总体分成了L个互不重叠的子总体(层)NV2,,Nl,即N=Nl+N2+此,分层随机抽样按照每个类别占总体的比例分配样本数量,或者用户根据对某个层赋权后确定样本数量,然后在每个类别中采用简单随机抽样的方法抽取样本。8.2.2 样本量计算影像识别分类产品作为一个总体,每个层的样本量叫可用公式(B2)计算。WinI=n(B.2)式中,Wi为第i个子总体(层)的权,W为所有层权的和。令Ni为第i个子总体像元数量,当Wi=NW=N时,即按照每个类别占总体的比例进行的分层随机抽样。8.3 系统抽样在识别分类总体N中,将全部像元按照行列编号排列,再根据B.1确定样本量n后,利用总体N/n确定抽样间隔6,然后随机选取第一个间隔内的一个样本,后续样本为第一个样本加上间隔6得到。注:系统抽样限制了样本的随机性。8.4 分层系统抽样在识别分类总体N中,令L为类别的数量,则各个类别将总体分成了L个互不重叠的子总体(层N2,,Nl,即N=Nl+N2+N1全部像元按照行列编号排列,再根据B.1确定样本量n后,利用总体数量N除以样本数量九确定抽样间隔6,然后在各子总体(层)中,采用在每个子总体(层)中的相同位置抽取份样的方法进行分层系统抽样,或者按照每个层确定抽样权后,根据抽样权计算每个层的样本数,在每个子总体(层)中分别计算抽样间隔后在每个子总体(层)的相同位置抽样。注:分层系统抽样限制了样本的随机性。附录C(资料性附录)抽样算例C.1算例总体例如某个矩形像元排列的产品,假设其像元总量为横向40行X50歹Ij,总体数量为2000个像元,类别数量为L,如下图所示。别(层MII一书一图C.1矩形分布40X50像元L类总体示意图C.2样本量计算令显著水平=0.05,则Z2=1.96,令可接受的绝对误差为0.04,取P=0.5,则由公式B.1计算样本量为:1.9620,50.50.9604n=2W=462(C.2)n<2I1962o.so.50.0020802U8+2000C.3简单随机抽样将像元按照行列数排列成N=2000个数组成的序列,然后在这个序列中随机抽取462个像元,即为简单随机抽样样本。C.4分层随机抽样定义各个类别(层)的权,每个类别(层)的样本量11i可用公式(B.2)计算。ni=462(C.4)W上式中,Wi为第i个类别(层)的权,W为所有层权的和。令Ni为第i个子总体像元数量,当Wi=NifW=N时,即按照每个类别占总体的比例进行的分层随机抽样。每个类别(层)的样本数量确定后,采用C.3获得每个类别(层)的样本,所有L个类别(层)的样本组合即为分层随机抽样的全部462个样本。C.5系统抽样在识别分类总体N中,将全部像元按照行列编号排列,利用总体像元数量除以样本数量得到抽样间隔6=4.3,然后随机选取第一个间隔内的一个样本,令其编号为i=3(i4),后续样本为第一个样本加上间隔得到,令后续样本编号为匕则k=i+6k=3+4.3k,将k四舍五入取整,即得到第k个编号的样本,按此顺序抽取全部462个样本。C.6分层系统抽样在识别分类总体N中,每个类别的全部像元按照行列编号排列,在根据B.1确定样本量几后,利用总体数量N除以样本数量几确定抽样间隔6=4.3,然后随机选取第一个间隔内的一个样本,令其编号为i=3(i4),例如在类别(层)1的第3个像元开始抽样,然后按照C.5在类别(层)1中抽取本层的全部样本,其它各个子总体(层)的样本也是在相同位置抽样得到,所有L个类别(层)的样本组合即为分层系统抽样的全部462个样本。或者按照每个层确定抽样权后,根据抽样权计算每个层的样本数,在每个子总体(层)中分别计算抽样间隔后在每个子总体(层)按照C.5抽样,所有L个类别(层)的样本组合即为分层系统抽样的全部462个样本。附录D(资料性附录)深度学习模型可靠性评价表格表D.1深度学习模型可靠性评价评估内容评估指标评估结果功能正确性评价查准率底)通过口不通过查全率回通过口不通过准确率M通过口不通过代码正确性评价代码规范性且)通过口不通过代码漏洞巨)通过口不通过目标函数影响优化目标的合理性回通过口不通过拟合程度合理性巨!通过口不通过对抗性样本影响对抗性样本训练后准确率反)通过口不通过附录E(资料性附录)基于深度学习的电力遥感目标识别分类产品真实性检验报告样例表E.1基于深度学习的电力遥感目标识别分类产品真实性检验报告待检遥感产品特征产品名称数据来源(传感器)地理参考(大地坐标系,投影方式)空间分辨率获取时间YYYY-MM-DD空间范围(°'“)经度:。”_O,”纬度:°'"。”产品生产采用的深度学习模型参考对象特征对象精度空间特征时间特征深度学习模型可靠性评价评价内容评价指标评价结果功能正确性评价查准率查全率准确率代码正确性评价代码规范性代码漏洞目标函数影响优化目标的合理性拟合程度合理性对抗性样本影响对抗性样本训练后准确率检验方法和结果直接检验像元尺度相对真值获取方法抽样方法产品准确度误差矩阵(附后)总体分类精度Kappa系数间接检验交叉检验参考影像特征描述空间分辨率获取时间总体分类精度Kappa系数抽样方法产品准确度误差矩阵(附后)总体分类精度Kappa系数趋势分析先验变化趋势(可附图)抽样方法产品变化趋势(可附图)产品和先验变化趋势相关系数操作人员描述备注附录F表F-I电力遥感影像目标列表巡视对象大类巡视对象中类具体巡视对象名称线路本体地基与基面回填土下沉回填土缺失塔基水淹塔基冻胀杆塔基础塔基下沉杆塔边坡保护不够塔基裂纹塔基露筋杆塔杆塔倾斜主材弯曲塔材缺失导/地线导线断线导线舞动导线异物导线弧垂过大或过小通道环境基础附近堆(取)土堆土隐患取土隐患建(构)筑物线下建(构)筑物树木(竹林)高大自然树木高大人工育林竹林施工作业施工开山采石火灾及易燃易爆物烟火(明火)易燃、易爆物堆积交叉跨越线与线跨越线与高速公路跨越线与铁路跨越大跨越防洪、排水、基础保护设施保护设施坍塌保护设施淤堵保护设施破损自然灾害地震洪水泥石流滑坡台风强降雪(积雪)道路、桥梁巡线道路破坏桥梁损坏易漂浮物塑料大棚农业地膜防尘网彩钢板顶其他污染源池塘(垂钓区)