个人隐私脱敏算法能力评估、分类示例、可逆性、信息偏差性、损失性、复杂性的计算方法、脱敏算法能力评估报告示例.docx
《个人隐私脱敏算法能力评估、分类示例、可逆性、信息偏差性、损失性、复杂性的计算方法、脱敏算法能力评估报告示例.docx》由会员分享,可在线阅读,更多相关《个人隐私脱敏算法能力评估、分类示例、可逆性、信息偏差性、损失性、复杂性的计算方法、脱敏算法能力评估报告示例.docx(17页珍藏版)》请在课桌文档上搜索。
1、附录A资料性)脱蚀算法能力评估示例概述本附录以k-匿名算法对文本类医疗数据的脱敏能力评估为例,介绍针对脱敏算法能力评估指标体系的使用方法,供进行脱敏算法能力评估时参考,脱收算法能力评估过程的关键处理环节包括脱被算法评估维度权重确定、敏感信息属性确定、评估指标选定、可逆性评估、信息偏差性评估、信息损失性评砧、更杂性评估以及评估报告生成.脱敏算法评估维度权重确定根据数据的使用场景、来就、脱敏意图等因案,定义脱技。法评估维度的权重.本示例中数据的应用场景为医疗问诊场景,数据模态为结构化数据,使用的k-匿名W法(脱坡参数k=3)屈于泛化技术,参考表A.1建议的不同脱敏算法类别(泛化、匿名、置换、差分或
2、私处理文本类医疗数据时的评估指标维度权重,将可逆性、信息偏差性、信息损失性、女杂性四个维度的对应权重分别为0.2、0.2、0.5,0.1.不同脱敏算法类别处理文本类医疗数据时的评估指标维度权重叁考ii信恩偏整性信息抠失性i性圜评估点番号权31褥估点方考权St参考ttR押估京普考权成化术泛技脱政算法是否可逆0.1脱收前后数据均值.04值息息整O1.0.5时间fi!fS0.05脱敏前后效据方经.(M还吼信息的港确性0.05脱收IW后数期均方於0.03K1.ift度0.03空同纪杂度0.05还原佑息的误差性0.05欧氏即悉0.03平均绝时值0.03的名技术脱敏算法是否可逆0.1脱故前后致据均值0.0
3、4信息嫡尤值0.5时间乂杂度0.05脱敏前后数据力差0.04还Ki信总的於确性0.05IftfeiWJfrft据均方差0.03K1.1.tt度0.03空间复汆慢0.05还瞭怡息的谯差性0.05Bfc氏手离0.03平均绝对值0.03*m技术脱或算法是否可逆03脱敏前4数据均依0.04倡总息案位0.2时间纭杂度0.05脱政前后数1方差0.04还原信息的推碗性0.1脱收前后数据均方差0.03K1.般度0.03空网0.05还原侑对的误差性0.1欧氏神离0.03手均绝对他0.03脱政算法是否可逆0.1脱地前后数M均值0.08信息燧差僮0.2时间乂杂度0.05弟分的私技术脱於前后攻据方整0.08还Iei伯
4、息的涯确性0.05脱敏前E数累均方差0.08K1.110.08空间0.05还原信息的误差性0.05欧氏即感0.09平均绝对低0.09敏感信息属性谈定收集并整理待评测的原始数据和经过k-匿名修法处理后的数据,在本示例中,原始数据如表A.2所示.k匿名算法处理后的数据如表A.3所示.确定本次脱敏操作的敏感信息M性为“年龄”.原始数据序号IW编年龄期症I4767729QK烧24760222心脏晒3476727心脏病44790543流期54790952心脏饶64790647癌在7476()530-C-IRVi476173694760732麻丘脱敏后数盘序号邮箱年舲I476”2*91:01247632心
5、脏切3476t*24.8I,脱敏前后数据的欧氏距离为11.0。,依据评估指标11.00938,故本次脱敢效果中的偏差性高。信息损失性评估计算知到脱陂函数捌的信,&淄为3.17.脱敏后数据的估息雌为1.58.脱敏的后数据的信息烟差值为1.59,依据评估指标006G.594.36,脱敏前后数据的互信息为0.48,依据评估指标O.40,180.8,故本次脱敏效果中的信息损失性中等.复杂性评估分析k-限名灯法的时间杂侬为O(ndog(n),空间红杂度为0(n),故本次脱败效果中的配杂性离。评估报告生成对可逆性评估结果、信息假养性评估结果、信息报失性评估结果、复杂性评估结果进行加权操作,得出算法能力的综
6、合评估结果,附录8(奥科性)脱敏算法分类示例概述本附录以脱收算法的按需选择为例.根据脱敏算法的实现原埋、应用场景、处埋数据方式等因素,可以分为差分的私、泛化、匿名、巴换四类技术,在本示例中,分别介绍般f差分盼私技术的脱收算法描述示例、基于泛化的脱故算法描述示例、基于匿名的脱敏立法描述示例和基于置换的脱敏灯法描述示例.供执行脱敏算法选择操作时参考.姑于差分隐私技术的脱敏算法衣BJ给出了27林基于差分隐私技术的脱故算法描述示例.友B.1基于差分隐私技术的脱敏算法描述示例序号名称编号功能使用方式11.ap1.aceMtx1.iaiiianA1.1.添加拉普拄斯嚎J*.返P1.添加曝声后的数值列表将入
7、:数值列K输出:S(Ui列表tt:隐私保护01别Wsk含义:选取班私用算2ReportNoisyMax1.-1.J1.PbCCA-1.-2添加拉普拉斯唯声,返I可添加n次魄加后的城大位索引列表轴入:数位列表输出:数位列表sfsk:酹私保护级别,乘样次数n器软;V义I选取融款招。,对输入的数值列&添加噪声的次数3RcponNoixyMaX3A-1.-3泽加拉甘拄期嗓声,返回添加n次噢出后的域大位列*输入:故值列表悔出:数次列表Stt.心品保护国别.采柞次数nStt选取越私预立,对输入的数值列表添加噪声的次数4SnappingMochnnismA-1-4滓加拉普依斯味声.这也I武斯后的故俶列发输入
8、:散位列表输出:数优列表被断边界B,采样次数。梦欲含义,数值列表中敏据的载断边界,对脩入的数值叫我淞加啖尚的次数5IM-CodCr1.A-1-5为图片添加捡甘拄斯噪声.这回加味后的图片输入I图片检出r图片参微Ia私保护级别畛数含义:或取送私1。6dpAJ沁A-1-6时小纹特征添加拉希拉斯*声.返回加噪后的音频输入I*输出Ift参微隐私保护级网ttZ.选取K1.私及以7dpGraphA-1.-7为图形IS据渐加拉普拉斯嚎出怖入I图形输出I图形参微隐私保护级期参(含义I选双跄私预算8dpDacA-I-S为日期数据滓加拉普拉斯味祖.SiM加味后的U期数组输入IH期列&输出IH期列表参微隘私保护蝮期参
9、数含义,选取防私预。9IM-Coder2A-1-9为图像渗加拉。拉斯噪MM后的图像输入I图像输出I图恢参数I隘私保护级别选取S3私预算IOExponcntia1.Meciiani、mA-2-1.返回一姐数值中期个数位被选中的“率.这回斛个致使被选中的察率幡入I数值列表输出I数次列表ft隘私保护SS别参数含义:选取魁私用口I1.Rco选取跄款孩以,对输入的数值列表添加噪声的次ft.川干比较的阈火,返M应答的计数C15S1rcVccinrTechniquc3A-3稀破向用技术,给IHf1.ift和网值t加11后进行比较.&n个比较结果列表幡入I数值列表输出I数值列表tk.Ia私保护级别,采样次数n
10、.M(f(c.计数C含义:选取K1.私预算.对输入的数值列表添加嗔出的次数.用于比收的阳位1.返阿应答的计数C16SparseVectorTcchnique4A-M树武向小技术,给数组例和储值t加啖后进行比较.Hn个比仅结果列表输入I数值列表输Hh牧何列表-r,:除稻保护级别.栗样次数n.Mtfi1.Jtic参数含义:选取跄想色界对检入的数值列表滋加鹏声的次畋,用于比较的阈U,返网应答的计数C17SpcrneVcviorTcchniquc5A-35稀M向量技术.论同U加嗓后与数If1.进行比较,返问n个比较拮果列表输入:数值列衣1IH:故假列衣:做私保护级别,采样次致n,WifU答效含义:选取
11、卷私Jf1.算对输入的散位列技添加噪小的次ft.用于比较的网Wt18SparseVectorTcchniquc6A3幡船向fit技术.除aaitffWffiiiM噢避行比较.返回n个比较结果列表检入:敞俄列衣抽出:数他列我龄Sk:隐私保护依别,采样次数n.MtfuS51iJG选取期私预3,对输入的数值列表添加喋出的次.用于比较的同u19Nunerica1.SparscVeiorTcdinxue.-3-7林然向纸技术,给故网位和网值I加味后进行比较.&Mn个比较玷米列K输入:数(ft列表输出:数(ft列表S4.IiS札保护侬别.采样次数n,Kff1.(,i1.ftc梦欲含义,选取的私预算.对输入
12、的数值列表添加耍出的次ft.用于比较的阙值1.返回应答的计数。20RappoiA-4-1.Ui尸H1.机啊机观计用户某特征的比方图(为次)与息,返I-In淮二进制敌凯输入I数值则我输Mh数值则表参数:陷私保护级别.采样次数n参数含义:选取险私用。,对谕入的数位列表浑垢暧潦的次攻21OneTiIt1.eKapPOfA-42些干防机看应就计用户某一特征的直方国(虢次)信息,返回n维二避制数机希人:数值列衣物出:数依列丧龄双:隐私保护依别,采样次数nS51iJG选取期私预3,对输入的数值列表添加喋出的次数22dpC11dc-4-1.城于随机驹应统诃用户某一特征的n方图频次)信见.这回数值列货愉入:数
13、位列表输出:数初列表Stt.融札保护级别tk含义,选取Sa私预算23unxMeanA-4-4为数出添加随机均句手防返回添加啖声后的数值列表输入I数值列表输出I数次列表Stt.隐私保护级别参*含义,选取的私用片24nm&xnIuip1.aceA45为教机添加1机拉普拉加哄湖.返回添加啖声后的故的列表输入I数值舛表输出I数软列表参数I隘科保护级别x.选取雌私预算25undomGaussiunA-4-6为数现海加随机密斯噪声.KBNSiI啖声后的数(ft列表输入I数值列表检出Ii位列我参加隘私保护力别参数含义:选取Q私依。26NoixyHisKynim1.A-4-7的在方图的每个城加明返回n堆攻1将
14、入:数值列表W)U1:数依列表#:南私保护级别采样次数n梦SC含义:志取珍.玄用舒,对输入的数值列代济加喋,h的次数27NoixyHhk驾HIm2A-4-K给)1方图的每个的加*并反馈影的门输入I数值列我,旬Ih代值列衣舲如能私保护级别.采样次数n警状含义:近双地弘用口,对输入的致值列会浑加联,的次数基于泛化技术的脱敏算法表B.2给出了22种基干泛化技术的脱敏算法描述示例.表B-2基于泛化技术的脱敏算法描述示例序号名称编号xftt使用方式ITruneationB1.-I收字符f;遥行星部截断,返回截断后的字符器输入:字符卡输出:字符:1:畲数I1私保护等级Stt选择是否进行字符小被新2F1.w
15、rBI-2对数值取整,这回取整后的数值输入:ft(ft输出:数值Stt.隐机保护级别参政含义I选择是否进行数位取整3HoorTimcH时时间取整,这回取整后的时间输入:符合时向格式要求的字符;1:输出:符令时间格式!求的字符*S1.RB机保护级别参政含义,选择是否进行时间取电4Mdre4HideB-1.-4会以体堆址侑息.返问a”后的地比信息输入I地址字符小饰出I地址字符小tt.IiS私保护出别参欲含义I选择将要保留的地的行政Kjy级别5da1.cjjrxHp-rcp1.aceB-1-5将日期敢据分A1.将分蛆内日IW怦横为同一日期.JS回处理后的日期列表输入I日期(衣输出:E1.期列衣参加隘
16、稻保护级别参数含义:选择分组大小6mixzonc.IB-2-1.生成仪名曲Jt1.ii息.返回t7.W俏息或假名ID输入I经度.纬收输出,位置信思字符串或假名ID#ft:用户id、进入区域的时向区域点集参数含义:用户id.用户进入该区域的时何,区域四个顶点的炫纬慢7mixzoic_3B22生成祖名位置怡1,返问位艮信息或假ID检入:势度、纬收检出:位置怯息字符4:或粗名ID用户id、进入区峻的时间、区域点集If1.k含义I用户id,用户进入该区域的时间,区域四个顶点的经件度8ACCUraCy.reductionB2-3根据特定的M便都求对用户发送过来的位五信息进行便用处理,返回处理后的经纬度输
17、入:经祎慢fi11i1.:住林度参Ifc1.隐私保护级别t不同的枕度需求9pixdntcB31.对图像打斗赛克,返回处理后的图像输入;图像输出;图像Stt.隐私保护级别布软含义I选择泄液核的大小IOgauaGan_NurB32对图像进行高斯模树,返I-I处理后的图像输入:图像输出:图像Stt.隐私保护级别tt选择裾斯造波哥泄液核的大小I1.bx.b1.urB33时图像进行盒式模糊,返网处理后的图像输入:图像输出:图像Stt.船私保护国别叁ii义I选择愈忒泣波5Ki液核的大小12mcanVauCIInagCB3-4时图像进行均1模树,返回处理后的图像输入:图像输出:图像畲数I1私保护级别卷iiJ
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 个人隐私 算法 能力 评估 分类 示例 可逆性 信息 偏差 损失 复杂性 计算方法 报告
链接地址:https://www.desk33.com/p-1710767.html