基于FP-Tree的关联规则增量式更新算法-BIT算法

基于FP-Tree的关联规则增量式更新算法-BIT算法

作者:师大云端图书馆 时间:2020-10-31 分类:硕士论文 喜欢:2400
师大云端图书馆

【摘要】随着科技的进步,人们所获得数据的手段越来越多,数据量也越来越大,可是面对这些海量数据进行分析处理的工具却越来越少。数据挖掘技术就是为满足对海量数据分析、处理的需求应运而生的。关联规则是数据挖掘技术中最重要的方法,Apriori算法是关联规则中最经典的一种算法,但Apriori算法需要多次扫描数据库,生成大量候选项集。本文通过深入分析研究关联规则算法,系统分析和总结了关联规则中一些提高算法效率的改进方法。首先,与Apriori算法相比而言,FP-Growth算法利用FP-Tree存储压缩原始事务数据,将挖掘频繁项目集的问题转化成挖掘FP-Tree的问题,减少了扫描数据库的次数,成为广泛应用的关联规则算法。但是FP-Growth算法过于依赖固定的最小支持度和固定的数据库,因此当最小支持度变化或者事务数据库发生变化时,不能直接利用先前挖掘出的频繁项目集,需要重新扫描数据库挖掘新的频繁项目集。最后基于此问题,本文提出了一种BIT(BatchIncrementalTree)算法,来解决当最小支持度和事务数据库同时发生变化时利用先前结果进行挖掘的一种增量挖掘方法。实验证明,BIT算法与Apriori算法和FP-Growth算法相比,大大提高了算法效率。本文的最后,通过一个案例加深关联规则在增量式更新方面的探讨。利用BIT算法解决当最小支持度变大,事物数据库增加时关联规则更新的问题。此时,无需再次扫描原始数据库,有效利用原频繁项集生成新支持度下的频繁1-项集。在生成新频繁1-项集后,删除了每个事务中不必要的项,也就是支持度计数小于新支持度的项,减少了搜索共享前缀的时间和计算不必要的项,降低了计算量,在其挖掘结果与FP-Growth算法挖掘结果一致的情况下,算法的运行时间大大减少了。因此,通过案例分析,不仅证明了BIT算法的执行效率高于FP-Growth算法,也证明了算法在实际应用中的可行性和通用性。
【作者】崔冠男;
【导师】庞智强;樊怀玉;
【作者基本信息】兰州商学院,应用统计,2014,硕士
【关键词】数据挖掘;关联规则;Apriori算法;FP-Growth算法;BIT算法;

【参考文献】
[1]张志景.儒家人际关系思想及其当代价值探析[D].北方工业大学,思想政治教育,2014,硕士.
[2]董辉跃,周华飞,尹富成.机器人自动制孔中绝对定位误差的分析与补偿[J].航空学报.
[3]朱玉凤.美对华FDI与中美贸易不平衡关系的研究[D].天津财经大学,国际贸易学,2012,硕士.
[4]倪逸,郭玲萱,李萍.利用多种模式识别法预测廊固拗陷含油砂体[J].石油地球物理勘探,1995,02:264-271+291.
[5]黄佼.往返于中国的想象与真实之间[D].厦门大学,法语语言文学,2014,硕士.
[6]闫生超,唐云善,张春平,张天兵,焦群.基于网络和时间关联关系的告警相关性分析[J].电力系统自动化,2011,09:78-81.
[7]郭元元.基于BQ24156芯片充电模块的设计与实现[D].西安电子科技大学,软件工程,2012,硕士.
[8]AbubakarMahmoudIddi.The Impact of Western Media on African Culture Zanzibar as a Case[D].外交学院,国际关系,2014,硕士.
[9]赵春明.大功率高精密硬车削液体静压电主轴热态特性研究及流—固耦合分析[D].广东工业大学,机械工程,2014,硕士.
[10]范晓杰.骨水泥填充比例与PVP治疗椎体转移瘤术后临床疗效的关系研究[D].河北医科大学,外科学(专业学位),2013,硕士.
[11]孙柳.双轴应变Si/应变SiGe CMOS关键技术研究[D].西安电子科技大学,电力电子与电力传动,2013,硕士.
[12]乔正立.对宁波港船舶交通安全评价的研究分析[D].大连海事大学,交通运输工程,2014,硕士.
[13]李更.C_(60)分子在石墨烯/钌表面生长行为的研究[A].中国真空学会(ChineseVacuumSociety).中国真空学会2012学术年会论文摘要集[C].中国真空学会(ChineseVacuumSociety):,2012:1.
[14]刘坪.不同类型中国企业的海外并购融资方式研究[D].北京交通大学,2014.
[15]苗芳.教育戏剧在幼儿阶段的应用[D].云南艺术学院,戏剧与影视学,2013,硕士.
[16]马保离,霍伟.非完整链式系统的时变光滑指数镇定[J].自动化学报,2003,02:301-305.
[17]李冉.高速高精度数模转换器的研究与设计[D].复旦大学,微电子学与固体电子学,2012,硕士.
[18]张付江.桥梁异型拱装饰结构强度分析[D].长安大学,机械工程(专业学位),2014,硕士.
[19]张振彦.城市与建筑的共生——具有城市意义的高层建筑控制方法探析[D].太原理工大学,建筑技术科学,2004,硕士.
[20]赵纯.发言人口音对英汉交传的影响及应对策略[D].北京外国语大学,外国语言学及应用语言学,2014,硕士.
[21]王佳.美国《幼儿至12年级英才计划标准》研究[D].首都师范大学,比较教育学,2013,硕士.
[22]谢琳婧.词汇组块法在初中英语阅读教学中的实验研究[D].河北师范大学,学科教学,2014,硕士.
[23]张鑫.耶路撒冷基督教社团研究[D].山西师范大学,世界史,2013,硕士.
[24]唐绎涵.“她”方—电影文学剧本《她》创作阐释[D].南京大学,戏剧(专业学位),2013,硕士.
[25]陶珊.工程图纸管理系统设计与实现[D].电子科技大学,软件工程(专业学位),2012,硕士.
[26]陈绚.论职工董事制度的完善[D].暨南大学,法学,2013,硕士.
[27]郝芳.基于地域文化差异的饭店沟通满意度实证研究[D].浙江工商大学,旅游管理,2012,硕士.
[28]庞增安.对我国粮食安全问题的理论思考[D].东北师范大学,马克思主义理论与思想政治教育,2003,硕士.
[29]左峰.基于建筑现象学的建筑界面设计研究[D].湖南大学,建筑设计及其理论,2011,硕士.
[30]陈远驰.中学数学反思性教学研究[D].华中师范大学,教育管理,2012,硕士.
[31]郭磊,赵克友.参数型不确定系统的鲁律严正实镇定[J].自动化学报,1995,03:377-379.
[32]蒲青松.中铁五局—公司集约化管理实践研究[D].西南交通大学,工商管理(专业学位),2013,硕士.
[33]袁俊.仿真系统与导弹武器的研制、试验和评估[J].飞航导弹.2004(04)
[34]贺友龙.高超声速目标等离子体流场电磁特性数值模拟[D].南京理工大学,电磁场与微波技术,2013,硕士.
[35]祁爱琳.高中思想政治课小组合作学习应用研究[D].东北师范大学,课程与教学论,2012,硕士.
[36]杨丽婷.广州市番禺区国库集中支付制度改革过程中存在的问题与对策[D].吉林大学,公共管理,2012,硕士.
[37]汤志伟,韩啸,廉青.现状与反思:我国行政管理硕士学位论文的实证分析[J].电子科技大学学报(社科版),2014,05:99-103.
[38]方杰.美洲黑杨不同无性系对分月扇舟蛾的抗性及其机理[D].南京林业大学,森林保护学,2004,硕士.
[39]潘学中.课堂教学评价实证研究——从“多元智能”实验看课堂教学评价[D].华东师范大学,教育经济与管理,2002,硕士.
[40]冯浩.先秦时期中原骑兵研究[D].河北师范大学,中国古代史,2012,硕士.
[41]邵雪兰.农业发展方式对农业面源污染的影响研究[D].南京农业大学,土地资源管理,2012,硕士.
[42]杨诗颖.面向铁路GPS轨迹融合的约束主曲线算法研究[D].北京交通大学,2015.
[43]朱虹.基于Sakai插件技术的研究生教育管理系统设计与实现[D].华中师范大学,计算机应用技术,2013,硕士.
[44]李慧慧.关于“レか”和“だけ”的对比研究[D].吉林大学,外国语言学及应用语言学,2013,硕士.
[45]刘莉.城市流动群体社会管理问题研究[D].华中科技大学,行政管理,2012,硕士.
[46]矫龙.一种柔性覆铜板用聚酰亚胺复合膜的制备及表征[D].吉林大学,有机化学,2014,硕士.
[47]何年琴,刘允,肖国丰.基于CRM的期刊报纸订阅读者推荐系统[J].图书情报工作,2005,11:69-71.
[48]朱德鹏.光码分多址技术的实验研究[D].天津大学,通信与信息系统,2004,硕士.
[49]赵晨宇.基于认知无线电次级市场的频谱拍卖机制研究[D].北京交通大学,通信与信息系统,2013,硕士.
[50]戴娜.中国现代文学中的“复仇”叙事[D].南京师范大学,中国现当代文学,2011,硕士.

相关推荐
更多