基于隐私保护的数据挖掘技术与研究

基于隐私保护的数据挖掘技术与研究

作者:师大云端图书馆 时间:2020-03-28 分类:硕士论文 喜欢:2675
师大云端图书馆

【摘要】随着计算机技术的发展和应用,数据挖掘技术应运而生,但是传统的数据挖掘技术大多在原始数据上进行挖掘,在发现知识的同时,很多隐私敏感信息亦不可避免的被侵犯到了;很多研究者调查总结的结论指出,在数据挖掘的过程中,大量的个人隐私信息在当事人不知情的情况下被公开使用,甚至滥用,对于这种个人隐私信息被随意使用甚至违法乱用的现象,人们很担心,有些国家法律也规定了相应的法律法规,来规范数据挖掘的技术途径,强化挖掘信息的保护意识,在各种社会压力的迫使下,人们在进行于数据挖掘的同时必须保障个人隐私信息不被泄漏,必须在保护隐私信息的基础上进行数据挖掘。基于隐私保护的数据挖掘技术的研究目的,是在数据库中提取事先未知的,有价值的信息和知识的同时,又不暴露隐私信息(至少是一些敏感信息)。出于对人们隐私信息的保护,对原始的数据库信息进行处理,就变得迫不及待,基于各类数据挖掘中都会触及个人隐私,本文将以DNA序列数据集为研究对象,对其数据挖掘过程中的隐私算法进行改进,主要研究内容如下:将基于最大权匹配的算法和基于隐私保护框架的弱聚类算法通过合理的改进之后,应用于DNA序列数据集的隐私保护算法中,针对已经存在的隐私保护算法DNALA算法的不足之处进行改进优化,提出新算法DNALA-IA,主要包括DNALA-DMA算法和DNALA-CA算法两部分,详见如下:(1)针对原来的DNALA算法所使用的多序列比对方法,存在比对时间较长,效率太低的问题,使用DNALA-DMA算法,该算法使用两两双序列比对的方法计算距离矩阵,不仅提高了序列比对的时间效率,同时DNALA算法最终结果精度不降低,而且在减少被挖掘信息损失度的前提下,实现了个人信息的隐私保护的目的。(2)针对原来的DNALA算法取得的结果精度不高而且不能实时更新聚类算法结果的缺点,使用DNALA-CA算法,该算法中的最大权匹配的聚类算法MWMCA,提高聚类结果的精度的同时,时间复杂度不变。该DNALA-CA算法中的数据流隐私保护框架WCPPF算法分为在线部分和离线部分,针对实时更新聚类结果的问题使用在线算法部分,快速的改变聚类结果,动态的维护数据流的变化。本文把DNALA-DMA和DNALA-CA算法配合使用,得到改进的DNALA-IA算法,实时选择合适的算法使用频率,取得最佳的聚类结果,挖掘知识金块!
【作者】孙二娟;
【导师】刘建平;
【作者基本信息】浙江理工大学,计算机应用技术,2014,硕士
【关键词】隐私保护;数据挖掘;聚类;最大权匹配算法;

【参考文献】
[1]姚玉婷.从股指期货与现货的互动关系看我国A股市场定价权[D].南京农业大学,金融学,2012,硕士.
[2]文丽芳.宫颈上皮内瘤变诊断及治疗的相关性分析[D].山西医科大学,妇科(专业学位),2013,硕士.
[3]孟凡华.能量回馈变频器的控制策略研究[D].哈尔滨工业大学,电气工程,2013,硕士.
[4]袁明.金属/石墨烯复合材料的制备及催化性能研究[D].浙江理工大学,2014.
[5]程棋波.PEC/PVA多层复合半透膜的制备及其分离性能研究[D].浙江理工大学,高分子化学与物理,2014,硕士.
[6]吴佳佳.石墨烯及其复合材料对溶解氧还原反应的影响[D].中国科学院研究生院(海洋研究所),2013.
[7]盛宝栋.锂电池管理系统的设计与实现[D].山东大学,控制理论与控制工程,2013,硕士.
[8]付林.物体表面轮廓光学动态检测与特征识别[D].南京理工大学,2007.
[9]谷凯.宁波市寿险产业的需求影响因素研究[D].宁波大学,产业经济学,2014,硕士.
[10]张雄华.我国跨境贸易人民币结算问题研究[D].上海交通大学,金融,2013,硕士.
[11]孙兵锋.小型化铷原子频标电子学系统和整机设计技术研究[D].中国科学院研究生院(武汉物理与数学研究所),无线电物理,2014,博士.
[12]张冰杰.异强再生混凝土叠浇梁受弯性能研究[D].华侨大学,防灾减灾工程及防护工程,2013,硕士.
[13]征丽晶.全流通时代A股上市公司中小投资者保护研究[D].浙江工商大学,会计学,2012,硕士.
[14]胡建东.电力营销管理信息系统建设思路探讨[J].中国电力,2001,10:66-69.
[15]王文超.人民币国际化理论与实践研究[D].沈阳师范大学,西方经济学,2014,硕士.
[16]张希威.基于p-型硒化锌纳米结构的p-n结构筑及其光电子器件研究[D].苏州大学,2014.
[17]隋明锐.阿什河哈尔滨段水质模拟与纳污能力核算的研究[D].哈尔滨工业大学,环境科学与工程,2013,硕士.
[18]付开封.腰椎后路减压、椎间融合器植骨融合、钉棒系统内固定术治疗腰椎滑脱症的临床效果分析[D].山东大学,外科学(专业学位),2013,硕士.
[19]袁文辉,刘晓晨,顾叶剑,占亮,李保庆,李莉.高真空低温剥离法制备高储氢性能石墨烯[J].功能材料,2013,01:17-21.
[20]宋阳.基于二分判定图的模拟电路层次化符号分析方法实现和性能比较[D].上海交通大学,电子科学与技术,2013,硕士.
[21]李玉阁.甲醇合成聚甲氧基甲缩醛工艺研究[D].辽宁石油化工大学,应用化学,2014,硕士.
[22]韩佳丽.PECVD法制备硅系材料的原位晶化与微结构研究[D].浙江大学,材料科学与工程,2014,硕士.
[23]孔德为.基于WEB的物流企业车辆管理系统分析设计与开发[D].吉林大学,软件工程,2012,硕士.
[24]陈怡.海上石油钻井平台责任制度研究[D].复旦大学,国际法学,2012,硕士.
[25]张帆.YZ30型振动压路机动力学分析、计算机仿真及参数优化[D].西安理工大学,机械工程,2003,硕士.
[26]王洪桥.基于主动支撑技术的薄主镜低阶面形误差校正研究[D].中国科学院研究生院(光电技术研究所),光学工程,2014,硕士.
[27]廉常军.西川煤矿迎采掘巷护巷煤柱宽度及围岩控制技术研究[D].中国矿业大学,采矿工程,2014,硕士.
[28]刘芳.河南省寿险需求增速放缓问题研究[D].郑州大学,保险(专业学位),2013,硕士.
[29]韩明霞.关于我国发行地方公债的“四性”研究[D].山西财经大学,财政学,2014,硕士.
[30]王云莉.辛亥革命时期《申报》新闻评论研究(1905-1912)[D].黑龙江大学,新闻学,2013,硕士.
[31]毛宗星,陈增强,孙青林,袁著祉.基于频域的广义预测控制器(GPC)的稳定性分析[J].控制与决策,2002,06:859-862.
[32]邓妮.多孔矿物基复合调湿材料的制备及性能[D].浙江大学,材料科学与工程,2014,硕士.
[33]于海亮.《黄帝内经》津液理论的研究[D].黑龙江中医药大学,中医基础理论,2013,硕士.
[34]翟长连,何苇,吴智铭.一类有约束的混合系统的模型及设计[J].控制与决策,2001,02:222-225.
[35]孙杨,孙小年,孔庆峰,宋瑞,何世伟.轨道交通新线投入运营下常规公交网络优化调整方法研究[J].铁道学报,2014,03:1-8.
[36]燕红亮.中国“新左派”思潮的动向与前瞻[D].华中科技大学,社会学,2013,硕士.
[37]李方方.中国番茄黄化曲叶病毒卫星DNA抑制转录后基因沉默的机理研究[D].浙江大学,植物病理学,2014,博士.
[38]纪文娟.孔子仁学思想融入高中《文化生活》课堂教学研究[D].湖南师范大学,学科教学(专业学位),2013,硕士.
[39]朱进.农民采用大棚蔬菜技术的影响因素分析[D].中国农业大学,种植业,2004,硕士.
[40]王铁.甲状腺术中喉返神经监测技术肌电图基本参数的解读和应用[D].吉林大学,临床医学,2013,硕士.
[41]王宇健.基于AE监测的金刚石切片刀刃磨技术研究[D].哈尔滨工业大学,机械制造及其自动化,2014,硕士.
[42]王腾飞.DD3镍基单晶合金多轴非比例加载低周疲劳研究[D].湖南工业大学,机械设计及理论,2012,硕士.
[43]孙伟.品牌资产价值评估研究[D].西安理工大学,企业管理,2004,硕士.
[44]周璇.辽东半岛和吉林东南部地区石构墓葬研究[D].东北师范大学,考古学与博物馆学,2012,硕士.
[45]金静花,田玉平.无线环境下拥塞控制算法的改进及其稳定性分析[J].控制与决策,2008,02:140-144+150.
[46]李新新.基于极大联合熵相空间重构和RQA的轴承故障诊断[D].燕山大学,检测技术与自动化装置,2014,硕士.
[47]朱红蕾,李明.维护关联规则的算法研究[J].兰州理工大学学报,2004,05:104-107.
[48]陈炳艳.从瘀论治输卵管性不孕的临床观察[D].黑龙江中医药大学,中医妇科学(专业学位),2013,硕士.
[49]李建民.油页岩改性沥青的制备与表征[D].西安科技大学,化学工艺,2013,硕士.
[50]李国平.齿轮加工裂纹的原因分析及消除方法[J].航空制造技术.2002(09)

相关推荐
更多