数据挖掘算法优化研究与应用

数据挖掘算法优化研究与应用

作者:师大云端图书馆 时间:2023-05-06 分类:硕士论文 喜欢:2221
师大云端图书馆

【摘要】随着现代社会的高速发展,各种各样的信息以及数据呈现爆炸式的增长,积累的信息和数据越来越多。这些存放在媒介中的海量数据,在没有外部工具的帮助下,人们很难从这些巨大的数据量中找到有用的信息,这些数据将成为垃圾数据。数据挖掘技术的出现,很好地解决了这个问题。数据挖掘技术可以从大量的数据中分析学习数据中对用户有用的模式和规则,利用这些学习到的模式和规则,当有新的样本数据的时候,可以根据已有的模式和规则来预测样本数据可能的特性。数据挖掘分类是数据挖掘的重要步骤之一,而在数据挖掘分类算法中,决策树分类算法是数据挖掘中应用较广的一种分类算法,它主要有ID3分类算法和C4.5分类算法,ID3有着简单易操作的优点,但也有着偏向于处理小数据集,以及只能处理离散属性的缺点,C4.5算法可以很好的弥补ID3算法对连续属性的处理不足的缺点,但C4.5算法同样有着处理增量学习和大数据量问题的不足。解决决策树算法的增量学习问题就是本文研究的切入点。本文主要对数据挖掘中的分类算法进行详细的介绍和描述,然后将分类算法和数据挖掘增量学习技术相结合,提出了一种增量式决策树算法来解决决策树经典算法的增量学习问题,并对该算法进行了实验数据分析。针对数据挖掘中常见的分类算法,包括:决策树分类算法、最近邻居算法和神经网络这三种最常见分类算法,进行了详细的介绍和描述,并对这三种算法的分类性能进行了比较研究。本文选取决策树分类算法中ID3算法和C4.5算法进行详细的研究,详尽的介绍了这两种分类算法的基本步骤,包括决策树生成和决策树剪枝的基本步骤并列举实例来演示算法的原理。同时分析了ID3算法和C4.5算法的优缺点;最后,根据前面对ID3算法和C4.5算法的性能和优缺点分析,综合贝叶斯分类算法的增量学习特性,提出了一种增量式决策树算法,并通过分析实验数据,该算法很好地解决了决策树算法的增量学习问题。
【作者】王明星;
【导师】刘锋;
【作者基本信息】安徽大学,计算机软件与理论,2014,硕士
【关键词】数据挖掘;分类算法;决策树;增量学习;

【参考文献】
[1]关集俱,许雪峰,何荣军,黄亦申,彭伟.β-环糊精与油酸包合物的制备和摩擦学性能[J].材料研究学报,2013,01:85-90.
[2]邱江.直升机主减速器主要性能参数评定方法研究[D].南京航空航天大学,机械设计及理论,2013,硕士.
[3]闫志娟.都市圈背景下北京新城发展研究[D].首都经济贸易大学,区域经济学,2014,硕士.
[4]李卓.中小企业服务供给的主体选择及其实现机制[D].清华大学,管理科学与工程,2003,硕士.
[5]杨静.消费者对菜籽油的购买意愿及影响因素分析[D].南京农业大学,农业经济管理,2013,硕士.
[6]孙英凤.有限责任公司股东优先购买权研究[D].华中科技大学,法律,2013,硕士.
[7]帅战民.我国残疾人社会保障体系建设研究[D].长安大学,公共管理(专业学位),2014,硕士.
[8]陈大鹏.嵌入式CAN/Ethernet网关的研究与应用[D].大连理工大学,测试计量技术及仪器,2004,硕士.
[9]杨苗苗.模拟海水浸泡对玄武岩与玻璃纤维增强筋长期性能的影响[D].哈尔滨工业大学,建筑与土木工程,2014,硕士.
[10]曲阳阳.日本动画片的角色精神对于中国青少年成长的启示和影响[D].沈阳师范大学,美术学,2013,硕士.
[11]蔡增琰.Smac和XIAP在人脑胶质瘤组织中的表达及意义[D].兰州大学,外科学,2014,硕士.
[12]于洋.我国农地产权制度改革研究[D].吉林大学,政治经济学,2013,硕士.
[13]高路.民事诉讼法学本科教材调查研究(1982-2010)[D].南京师范大学,诉讼法学,2012,硕士.
[14]邹璇.甲状腺功能在脑出血急性期变化特点的研究[D].吉林大学,临床医学,2014,硕士.
[15]邵涛,章程,于洋,方志,徐蓉,严萍.空气中纳秒脉冲均匀介质阻挡放电研究[J].高电压技术,2012,05:1045-1050.
[16]李钦.一种无线传感器网络MAC层协议改进方案[D].南京邮电大学,计算机应用技术,2013,硕士.
[17]张雨豪.基于Split Mapping的结构变异检测方法的模拟环境的研究和开发[D].哈尔滨工业大学,计算机科学与技术,2013,硕士.
[18]任小平.经济转型背景下的劳动关系特点及其调整策略研究[J].中国劳动关系学院学报,2014,05:1-4.
[19]张学忠.江苏省体育传统项目学校(中学)女子足球运动发展现状的调查与研究[D].苏州大学,体育教育训练学,2013,硕士.
[20]宋亮.沙棘多糖的提取纯化及体内、体外功能研究[D].内蒙古农业大学,生物化学与分子生物学,2012,硕士.
[21]韩文珠.生态学视角下农村初中教师合作学习研究[D].西南大学,课程与教学论,2013,硕士.
[22]陈曦.复杂产品虚拟样机技术及其应用研究[D].南京理工大学,2005.
[23]李军.低压配电系统电气故障分析与研究[D].沈阳工业大学,电机与电器,2013,硕士.
[24]宫丽.二氧化钛光催化及硅烯电子结构特性研究[D].济南大学,2014.
[25]贾文龙.宋代秘密宗教与法禁研究[D].河北大学,中国古代史,2002,硕士.
[26]沈艳玲.重庆市中小学生“每天锻炼一小时”实施情况调查研究[D].西南大学,体育人文社会学,2013,硕士.
[27]刘金生.金州新区农村民主政治建设研究[D].大连理工大学,公共管理(专业学位),2012,硕士.
[28]张晓薇.葛根素对鱼藤酮诱导帕金森模型的保护作用及其机制[D].华中科技大学,神经内科,2013,硕士.
[29]张文雨.政府购买社工服务的互动机制与发展研究[D].山东大学,行政管理,2013,硕士.
[30]丁纪云,蔡春娥.利用构造数据集评定数据挖掘过程的方法[J].湖南广播电视大学学报,2001,02:78-79.
[31]江源.植物群落对景观温度特征指示作用的研究[J].植物生态学报,2000,05:523-527.
[32]钟程.移动商务客户信任度影响因素研究[D].华中师范大学,管理科学与工程,2013,硕士.
[33]李怡萱.英语商务合同长句汉译实践报告[D].大连海事大学,英语笔译,2014,硕士.
[34]王翠莹.蒋士铨《铜弦词》研究[D].吉林大学,中国古代文学,2013,硕士.
[35]赵洪初.作业成本法在物流成本管理中的应用[D].大连海事大学,交通运输规划与管理,2004,硕士.
[36]赵会朋..NET平台下Web系统构架研究及在煤炭行业的应用[D].西安建筑科技大学,计算机应用技术,2004,硕士.
[37]张皓,武振楠,董春伟,刘轶.金纳米簇自组装多层与单层[A].中国化学会高分子学科委员会.2014年两岸三地高分子液晶态与超分子有序结构学术研讨会摘要集[C].中国化学会高分子学科委员会:,2014:1.
[38]赵毅娜.基于离子输入逻辑门的DNA荧光生物传感器研究[D].陕西师范大学,2013.
[39]李燕.一类振荡聚合模型的稳态性质[D].天津大学,应用数学,2013,硕士.
[40]陈珊.新准则下信息技术业上市公司无形资产价值相关性研究[D].成都理工大学,企业管理,2013,硕士.
[41]胡羽.软测量技术研究及其工业应用[D].兰州理工大学,机械电子工程,2013,硕士.
[42]苗亮.基于HIV-1包膜蛋白gp41近膜端外区分支抗原肽免疫活性及结构的初步研究[D].吉林大学,生物工程,2013,硕士.
[43]胡永利.银和钯银纳米材料的可控制备及电催化性能研究[D].华侨大学,2014.
[44]景璇.延安市标准化高中英语课程标准实施情况的调查[D].延安大学,学科教学,2014,硕士.
[45]刘铁,鲁铁成,李建胜,何清,田侃,宋志国.高压电气设备绝缘状态管理与评估系统[J].电力系统自动化,2007,12:100-104.
[46]郭生昌.沉淀池的计算机数值模拟[D].东华大学,环境工程,2004,硕士.
[47]罗明晶.国产雷帕霉素药物涂层支架置入术对缺血性心肌病患者近中期预后影响的临床研究[D].桂林医学院,内科学,2012,硕士.
[48]潘冰洁.红绿彩之色彩研究[D].景德镇陶瓷学院,设计艺术学,2012,硕士.
[49]黄廷胜.系统化事故调查方法研究[D].华东理工大学,安全工程,2013,硕士.
[50]陈奋.论音乐表演中的体验[D].中国音乐学院,音乐学,2013,硕士.

相关推荐
更多