加权关联规则优化算法研究

加权关联规则优化算法研究

作者:师大云端图书馆 时间:2025-04-28 分类:硕士论文 喜欢:648
师大云端图书馆

【摘要】关联分析是数据挖掘领域的主要分支,用于发现隐藏在数据中有意义的联系。该领域中,加权关联规则挖掘算法与传统算法相比,更有利于解决数据库中项目分配不均和重要程度不同的问题,因此相关研究越来越受到人们重视。本文重点研究加权关联规则算法。首先系统介绍了流行的加权关联规则模型,比较了他们的优劣势。在深入研究各个模型的优点的基础上采用了一种基于聚类和压缩矩阵的加权关联规则挖掘策略,挖掘加权频繁项集。其主要思想是采用矩阵作为数据库数据存储运算结构,运用空间换时间的思路减少数据库访问频率,利用聚类划分的方法分解数据库,进行分布挖掘,降低内存占用空间,通过局部频繁项集生成全局频繁项集,引入事务权重和数据库权重的概念优化权值计算方法,使其满足支持度度量的反单调性,提升拼接和剪枝水平,与传统加权算法相比,减少了访问数据库的频次,提高了候选项集剪枝效率,整体上提升了算法的性能和准确度。同时,为了避免由单支持度导致的挖掘低兴趣度的规则以及出现冗余无效规则等问题,本文借鉴动态更新的思想引入了多最小支持度的概念,结合垂直数据和项集等价划分的思想,设计了一种新的基于多支持度的加权关联规则挖掘算法(ANewAlgorithmofWeightedAssociationRulesMiningwithMultipleMinimumSupports,NAWARM_MMS),该算法中不同项集对应给定的不同的最小支持度,通过对项目设置不同的支持度阈值,实现在不同重要程度的数据项中挖掘出数据量小,但用户更感兴趣、更有价值的关联规则。仿真实验中,通过测试在不同事务数、不同支持度、不同项目数以及不同项目稠密度的情况下算法的运行时间,验证了改进的基于聚类和压缩矩阵的加权关联规则算法,在处理低稠密度数据时,具有更大的优势,算法复杂度优于基本加权关联规则算法;而进一步的对于改进后的NAWARMMMS算法,测试在不同阈值整体水平和不同事务数的情况下运行时间,实验表明,由于垂直数据存储结构、矩阵压缩方法以及项集等价划分策略的引入,使得算法在I/O负载、候选项集和事务压缩规模上都得到优化,整体性能略优于传统多支持度算法。
【作者】余方兴;
【导师】戴上平;
【作者基本信息】华中师范大学,计算机应用技术,2014,硕士
【关键词】加权关联规则;压缩矩阵;多最小支持度;等价划分;

【参考文献】
[1]蔡致远,魏藜,钱卫宁,周傲英.DEODS:快速准确的数据流密度估计[A].中国计算机学会数据库专业委员会.第十九届全国数据库学术会议论文集(研究报告篇)[C].中国计算机学会数据库专业委员会:,2002:4.
[2]唐凯江.企业竞争优势构建研究[D].四川大学,工商管理,2003,硕士.
[3]陈钊.石灰浆制备过程计算机控制系统设计与开发[D].东北大学,控制理论与控制工程,2010,硕士.
[4]韩林林.智能配电网网络重构方法的研究[D].郑州大学,电气工程(专业学位),2013,硕士.
[5]周志英.蒙脱土层间结构对后过渡金属催化乙烯聚合反应的影响[D].浙江大学,高分子化学与物理,2004,硕士.
[6]郁卫国.张养浩的儒家思想及诗文研究[D].宁夏大学,中国古代文学,2014,硕士.
[7]马萍.兰州市五所普通中学研究性学习课程管理探析[D].西北师范大学,教育,2003,硕士.
[8]李华琦.金融资产和住房资产财富效应的研究[D].浙江工商大学,金融学,2013,硕士.
[9]臧勇真.基于统计和规则的中文人名识别研究与实现[D].西南交通大学,计算机技术,2013,硕士.
[10]徐世演.基于认知无线电的自适应信道编解码器的研究与实现[D].西安电子科技大学,通信与信息系统,2012,硕士.
[11]屠宁雯.城市道路交通网络脆弱性辨识方法研究[D].苏州大学,计算数学,2013,硕士.
[12]王玲1,符永高1,肖勇2,万超1,李明雨3,杜彬1.凝固超声处理对Al/Zn-3Al/Cu钎焊接头显微形貌及性能的影响[J].电子元件与材料,2014,12:.
[13]周慧江.复发性肝癌的早期诊断和治疗分析[D].浙江大学,外科学,2004,硕士.
[14]刘园.论我国个人破产法律制度的构建[D].大连海事大学,法律,2013,硕士.
[15]解玮珊.社区养老志愿服务中的社工介入研究[D].苏州大学,社会工作(专业学位),2014,硕士.
[16]李细珍.我国刑事非法证据排除规则适用程序研究[D].华中师范大学,诉讼法学,2014,硕士.
[17]王志彪.VISSIM交通仿真适用性研究[D].北京交通大学,2007.
[18]钟桂芳.发酵木糖产酒精高温酵母菌株构建的研究[D].中国农业大学,食品科学,2004,硕士.
[19]李哆咪.论融资性备用信用证[D].中国政法大学,比较法学,2014,硕士.
[20]姜程.直接PCI术中三种药物洗脱支架应用效果的系统评价[D].兰州大学,内科学,2013,硕士.
[21]赵亮.南湾鳙鱼鱼肉品质特性研究[D].西北农林科技大学,食品加工与安全,2012,硕士.
[22]钟智,罗大庸,刘少强,樊晓平,瞿志华,李勇周.具有移动sink的无线传感器网络能量均衡分簇路由协议[J].控制与决策,2012,08:1211-1215+1220.
[23]邵岩.基于RTDS的地铁牵引供电系统建模与仿真[D].西南交通大学,电力系统及其自动化,2014,硕士.
[24]姜楠.论有限责任公司股东资格的确认[D].吉林大学,民商法学,2014,硕士.
[25]张蜜.药品广告监管的法经济学分析[D].中国政法大学,法律,2013,硕士.
[26]王晓霞.试论冷战后美国对外政策中的霸权稳定论[D].湘潭大学,国际关系,2003,硕士.
[27]李士杰.青霉烯关键医药中间体——氮杂环丁酮的合成[D].河北工业大学,化学工艺,2004,硕士.
[28]郭莹.急性低氧对大鼠空腹血糖的影响[D].青海大学,内科学,2013,硕士.
[29]唐桂菊.重组人maspin蛋白对绒毛外滋养细胞的影响在子痫前期发病机制中的研究[D].华中科技大学,妇产科学,2013,硕士.
[30]郭玉琼.中国现代话剧艺术的诗性精神研究[D].福建师范大学,戏剧戏曲学,2004,硕士.
[31]李永清.北京地铁基层员工培训研究[D].北京交通大学,2013.
[32]吴敌.汽车经销商客户关系管理系统的设计与实现[D].吉林大学,软件工程,2014,硕士.
[33]秦妙.西安市拓展训练机构发展现状的研究[D].西安体育学院,体育,2013,硕士.
[34]李因刚,柳新红,马俊伟,石从广,朱光权.浙江楠种群表型变异[J].植物生态学报,2014,12:1315-1324.
[35]王晨.全面抗战前(1912-1937)河北外来物种引进分析[D].河北师范大学,中国近现代史,2013,硕士.
[36]赵新慧.家蚕马氏管响应BmNPV感染相关miRNA的初步研究[D].江苏科技大学,生物化学与分子生物学,2013,硕士.
[37]王妮娜.超限运输治理政策研究[D].西北大学,公共管理(专业学位),2012,硕士.
[38]孙岩.平朔安家岭选煤厂破碎站粉尘逸散机理与控制技术研究[D].辽宁工程技术大学,安全技术及工程,2012,硕士.
[39]杨帅.基于NPTB模型的影视网站交叉销售组合预测研究[D].江苏科技大学,工业工程(专业学位),2014,硕士.
[40]黄茜.上市公司环境信息披露的经济后果研究[D].西南大学,会计学,2014,硕士.
[41]林卫丽.高强韧镁-稀土系镁合金研究现状及展望[J].热加工工艺,2015,04:12-15+24.
[42]牟娜娜.论库切小说的多元叙事[D].山东师范大学,比较文学与世界文学,2013,硕士.
[43]赵阳.媒体在司法机关舆情危机时形象修复效能研究[D].西南政法大学,新闻学,2012,硕士.
[44]丁艳.楔横轧偏心轴模具设计及数值模拟[D].燕山大学,机械制造及其自动化,2014,硕士.
[45]李小勇.优质啤酒专用稻的筛选[D].湖南农业大学,作物遗传育种,2004,硕士.
[46]郭建正.基于光栅尺反馈的高精度二维运动转台研究[D].北方工业大学,检测技术与自动化装置,2013,硕士.
[47]杨冲.节能赛车的车架轻量化与车身动力学研究[D].太原科技大学,车辆工程,2014,硕士.
[48]蒋勇.牛支原体免疫原性研究[D].西南大学,基础兽医学,2013,硕士.
[49]夏炳梅.视觉传达设计课程教学网站的设计与实现[D].山东大学,软件工程(专业学位),2012,硕士.
[50]胡祖珺.《围城》中幽默语英译的概念整合理论解读[D].宁波大学,英语语言文学,2014,硕士.

相关推荐
更多