提供差分隐私保护的线性查询新方法
【摘要】差分隐私是一种处理敏感数据分析任务时的隐私保护原理,在许多的场合下都得到了成功的应用。差分隐私与许多更早的隐私保护原理不同,它定义了十分严谨的隐私担保形式,并要求其数据分析技术都能够从数学上严格证明满足所定义的隐私担保。简单来说,差分隐私在数据发布过程中对任何个人敏感数据参与发布过程所招致的风险进行了定量的控制,从而使任何攻击者都无法从发布结果推断出任何单个参与者的敏感信息。目前,研究者们已经对差分隐私进行了大量的研究工作,并提出了许多有效的敏感数据分析方法。然而,差分隐私作为一个新的研究领域,仍然有许多新的问题有待解决。在这篇论文中,我们提出了三种在差分隐私下进行数据查询的新方法,显著提高了敏感数据查询的效率与有效性。实现差分隐私的一个最简单有效的方法是Laplace机制,它通过往查询结果中引入独立同分布的Laplace噪声来隐藏个人信息。虽然这个方法十分简单且被广泛应用,但它却要求查询结果对个体参与者的全局敏感度必须是有限而且较小的。对于许多复杂查询,例如SQL查询结果上的聚合以及子图计数,查询结果却很可能有着过大甚至无限的全局敏感度。现有的差分隐私机制并不能够处理如此复杂的查询。我们首先提出了一个基于经验敏感度的查询机制,它可以处理跟个体参与者之间有着复杂关系的查询,并且允许查询有无限大的全局敏感度。除此之外,我们的机制还能用于处理任意的子图计数查询并实现节点差分隐私,而这在过去是无法做到的。对于许多线性查询,Laplace机制所引入的独立噪声并不是最优的。为了优化查询精度,一些机制往查询结果引入相关的噪声来减小所需噪声的大小。然而,当查询序列是用户任意给定时,这些机制为了找到最优的噪声分布需要的计算开销非常大,随数据维度增加呈指数增长。因此,这些机制在实践中无法用于高维数据集。我们提出了一个基于子敏感度概念的改进机制,它不但可以通过往查询结果引入相关的噪声来优化查询精度,且其计算开销随数据维度增加仅呈多项式增长。因此,它在实践中的效率和可用性跟以往的方法相比有着显著的提高。最后,我们提出了一种用于整合所有已知查询结果的后处理技术,以利用查询中隐藏的冗余性和相关性来提高查询的精度。我们的方法还可以在隐私预算完全耗尽的场合下根据已知的信息给新查询返回有意义的估计结果。这个方法的一个重要优点是,它避免了在整个数据域上显式地构造柱状图,对于许多重要的查询类型它的计算开销随数据维度增加仅呈多项式增长,因此可适用于高维数据集。
【作者】陈世熹;
【导师】周水庚;
【作者基本信息】复旦大学,计算机软件与理论,2012,博士
【关键词】隐私保护;差分隐私;Laplace机制;全局敏感度;局部敏感度;递归机制;平滑敏感度;经验敏感度;子敏感度机制;K-norm机制;主成分分析;最大熵;
【参考文献】
[1]王莉群.第三方物流企业顾客服务战略研究[D].武汉理工大学,产业经济学,2004,硕士.
[2]刘瑞娟.基于空间视角的区域联系分析[D].长安大学,产业经济学,2014,硕士.
[3]邬莉萍.贿赂犯罪适用诱惑侦查的问题研究[D].南昌大学,法律(专业学位),2012,硕士.
[4]刘云岸.二态交配系统植物异叶假繁缕的繁殖生态学研究[D].东北师范大学,生态学,2012,硕士.
[5]马荣华,黄杏元,朱传耿.用ESDA技术从GIS数据库中发现知识[J].遥感学报,2002,02:102-107+162.
[6]李彬.试析北洋实力派与国内各界对外蒙事变的态度及影响[D].河北大学,中国近现代史,2003,硕士.
[7]牛帅.农业上市公司社会责任与财务绩效关系研究[D].黑龙江八一农垦大学,农村与区域发展,2014,硕士.
[8]李晨.职业成熟度结构与测量模型的效度概化及问卷编制[D].湖北大学,发展与教育心理学,2012,硕士.
[9]杨秀丽.中泰两国上市公司股权资本成本比较研究[D].首都经济贸易大学,会计学,2014,硕士.
[10]姜晓巍.基于X射线的图像区域检测及货车检测系统[D].吉林大学,计算机应用技术,2014,硕士.
[11]陈新.中国石油集团公司IT管理研究[D].北京交通大学,工商管理(专业学位),2013,硕士.
[12]张步才.饱水黄土隧洞支护衬砌结构设计研究[D].兰州大学,建筑与土木工程(专业学位),2013,硕士.
[13]黄河.达州电力设计院电力参数测试系统的设计与实现[D].电子科技大学,软件工程(专业学位),2012,硕士.
[14]陈宏明.二维碎片拼合技术研究[D].南京航空航天大学,航空宇航制造工程,2004,硕士.
[15]孙丽萍.古典诗学的现代阐释[D].安徽师范大学,文艺学,2004,硕士.
[16]王永婕.基础英语课堂教师教学活动、学生话语产出及其相关性的研究[D].东北师范大学,外国语言学及应用语言学,2012,硕士.
[17]刘颖.关于复句中“し”的分类[D].吉林大学,日语语言文学,2014,硕士.
[18]周柳光,王仲东.LG9901型自动打标机微机控制系统的开发研制[J].冶金自动化,2001,01:50-51.
[19]刘彤.中国人力资源会计应用研究[D].吉林大学,会计学,2013,硕士.
[20]周聪.中美机电产品产品内贸易研究[D].沈阳工业大学,国际贸易学,2013,硕士.
[21]黄庆平.《注塑模设计》课件平台的研究与开发[D].南京航空航天大学,航空宇航制造工程,2004,硕士.
[22]苏煜,山世光,陈熙霖,高文.基于全局和局部特征集成的人脸识别[J].软件学报,2010,08:1849-1862.
[23]吕慧鹏.山东省城市高中篮球运动发展现状的调查研究[D].辽宁师范大学,体育教育训练学,2012,硕士.
[24]王鹏.航空旅行路径规划问询系统的研究与实现[D].沈阳工业大学,计算机应用技术,2003,硕士.
[25]王松.等截面PC连续箱梁桥施工温度场及裂缝控制研究[D].长安大学,建筑与土木工程(专业学位),2014,硕士.
[26]严峻.基于XML的连锁企业物流配送信息系统研究与实现[D].西安理工大学,技术经济及管理,2004,硕士.
[27]张议.基于几种巯基改性石墨烯复合物的电分析研究[D].湖南师范大学,药物分析学,2014,硕士.
[28]薛晖.预算绩效管理改革与行政事业单位财务管理模式探讨[D].首都经济贸易大学,会计学,2013,硕士.
[29]何增芬.乌腺金丝桃与丹参抗实验性快速心律失常的配伍研究[D].黑龙江中医药大学,方剂学,2014,硕士.
[30]陈文荣.基于GPRS的仪表数据采集与监控系统[D].浙江大学,2005.
[31]罗益锋,罗晰旻.军民两用功能纤维与纳米纤维新进展[J].高科技纤维与应用,2014,06:1-10.
[32]王润球,徐彦儒,郑湘明.依托“亚包中心”,建立我国包装经济发展的研究基地[J].中国包装.2002(05)
[33]罗小风.GDWT公司财务状况分析研究[D].兰州大学,工商管理(专业学位),2013,硕士.
[34]王志华.基于分子印迹聚合膜的电化学传感器和生物传感器的研制[D].西北师范大学,2007.
[35]任克江.基于地理信息的检索和用户数据挖掘[D].大连理工大学,计算机应用技术,2013,硕士.
[36]孙建刚.中国东盟睦邻外交政策探析[D].吉林大学,国际政治,2014,硕士.
[37]金武,陈珵.从方具有多目标的仿射型诱导策略研究[J].控制与决策,1994,05:375-378.
[38]杨洋.中信银行法人信贷客户综合评价系统的设计与实现[D].山东大学,软件工程(专业学位),2013,硕士.
[39]郭凯强.基于RFID的烟花爆竹经营与流向监管系统[D].山东大学,软件工程(专业学位),2013,硕士.
[40]刘臣.曹妃甸发展投资集团有限公司绩效考核体系研究[D].燕山大学,工商管理,2012,硕士.
[41]李庆.扶余油田低温破乳剂的研究与应用[D].东北石油大学,石油与天然气工程(专业学位),2013,硕士.
[42]刘杨毅.高中历史教学中的经济意识教育研究[D].鲁东大学,学科教学(专业学位),2014,硕士.
[43]孙文国.论市政公用行业的竞争与发展[J].中共济南市委党校学报.2005(01)
[44]寇宁.小微信贷管理信息系统设计与实现[D].山东大学,软件工程(专业学位),2013,硕士.
[45]韩同伟,贺鹏飞,王健,吴艾辉.单层石墨烯薄膜拉伸变形的分子动力学模拟[J].新型炭材料,2010,04:261-266.
[46]张文君.农村寄宿制初中留守儿童教育问题与校本策略研究[D].扬州大学,教育学原理,2011,硕士.
[47]尹冀.汽车钢制车轮的冲击性能仿真与轻量化研究[D].上海交通大学,车辆工程,2013,硕士.
[48]毛胜男.不同切端设计全瓷贴面抗压强度分析[D].辽宁医学院,口腔临床医学,2012,硕士.
[49]王海峰,胡德金.最小二乘支持向量机的一种稀疏化算法[J].计算机工程与应用,2005,33:72-74.
[50]徐庆斌.论举证责任及其分配标准[D].中国政法大学,法律,2004,硕士.

相关推荐
- 水牛与奶牛黄油低脂肪涂抹物的研究
- 09月05日
- 聚天门冬氨酸高吸水性树脂的合成及性能的研究
- 03月05日
- 荆州方言动态助词“哒”、“倒”、“起”的相关研究
- 01月30日
- 南京科技创业服务中心孵化项目风险管理研究
- 05月24日