基于神经网络的数据挖掘分类算法比较和分析研究
【摘要】随着信息技术的发展,人们生产数据和采集数据的能力愈来愈高,但是,我们在数据分析和知识获取方面,能力还相对滞后。因此,从收集数据、创建数据库,管理数据,到数据分析,数据挖掘技术渐渐产生和发展。数据挖掘(DataMining,DM)是一门跨学科的课题,涉及许多领域,包括统计学(Statistics)、数据库(Database)、机器学习(MachineLearning)和人工智能(ArtificialIntelligence)等。数据挖掘,也被称为数据库中的知识发现,是从“海洋般”的大量数据中获取新颖的、有用的、有效的、可理解的模式的非平凡过程,也就是从大量数据里提取知识。分类(Classification)问题是数据挖掘技术中非常重要的研究课题,利用分类技术,可以从数据集中提取出描述数据类相同的模型或函数,并且能够顺利把数据集中每一个未知类别的数据划归到某个已知的类别中去。目前,常用的数据挖掘分类算法主要有:统计分类法、决策树、人工神经网络方法等。不同的算法会产生不同的分类器,而不同的分类器又会影响数据挖掘的准确率和数据挖掘的效率。因此,当面对数据量庞大的分类问题时,选择适当的分类算法是非常有必要的。人工神经网络(ArtificialNeuralNetwork,ANN)是数据挖掘常用的方法之一,该方法通过模拟人脑生物神经网络,将若干个具有处理功能的神经元(neurone)节点,按照一定的网络结构连接起来,使它能够处理不精确数据、模糊数据或者复杂的非线性映射问题。人工神经网络能够识别的模式是由网络的连接权值、拓扑结构及神经元阈值决定的。通过优化人工神经网络的拓扑结构及网络的权值、阈值,可以达到优化人工神经网络模型的目的。本文针对实际应用中的分类问题,详细介绍了三种人工神经网络算法的网络结构和算法描述,以及三种算法的优缺点,重点阐述了极限学习机的理论基础。将极限学习机算法应用于六个真实的数据集中,实现分类应用试验,并对实验结果与支持向量机和BP算法实验结果进行比较分析。通过实验结果发现,极限学习机在分类时间和准确率等反面,均具有明显的优势。
【作者】常凯;
【导师】王爱平;
【作者基本信息】安徽大学,计算机应用技术,2014,硕士
【关键词】数据挖掘;分类;人工神经网络;BP神经网络;支持向量机;极限学习机;
【参考文献】
[1]郝瑞欣.纱线气圈数字图像处理方法的研究[D].武汉纺织大学,机械电子工程,2013,硕士.
[2]王小春.MEMS微惯性航姿系统的优化设计与集成技术研究[D].南京航空航天大学,检测技术及自动化装置,2013,硕士.
[3]林浩.52例胰腺癌临床病例回顾[D].蚌埠医学院,肿瘤学(专业学位),2013,硕士.
[4]纵永安.内掺型防水处理的PVA-SHCC高温后性能试验研究[D].青岛理工大学,建筑与土木工程,2013,硕士.
[5]郑建明.基于HMM的多特征融合钻头磨损监测技术的研究[D].西安理工大学,2004.
[6]刘彩波.产业聚集区服务供应链协同商务模式研究[D].湖北大学,企业管理,2012,硕士.
[7]贺俊,黄阳华,沈云昌.校企合作研发的最优制度安排[J].中国工业经济,2011,02:151-160.
[8]邓俊敏.县级政府机构设置问题研究[D].西南交通大学,公共管理(专业学位),2013,硕士.
[9]操军.A公司聚氨酯添加剂在印度市场发展的营销策略研究[D].华东理工大学,工商管理(专业学位),2013,硕士.
[10]谷雨.阜阳市返乡农民工创业支持体系研究[D].内蒙古农业大学,农业推广,2013,硕士.
[11]王君芬.我国区域金融的发展差异及空间效应研究[D].浙江工业大学,2009.
[12]解海玲.含裂纹无限大横观各向同性压电材料板断裂分析[D].太原科技大学,应用数学,2014,硕士.
[13]丁峰.高超声速滑翔—巡航两级乘波设计方法研究[D].国防科学技术大学,流体力学,2012,硕士.
[14]韩艳星.功能化碳微球自组装膜的研究[D].太原理工大学,2011.
[15]李田田.短暂非线性交替波检测技术[D].山东师范大学,信号与信息处理,2013,硕士.
[16]王璐.戊戌时期士大夫集团的农业观[D].吉林大学,中国近现代史,2013,硕士.
[17]侯晓强.玉米大斑病菌(Setosphaeria turcica)有性杂交后代的生理分化和遗传多态性[D].河北农业大学,植物病理学,2004,硕士.
[18]汪浩,于凌飞,陈立同,王超,贺金生.青藏高原海北高寒湿地土壤呼吸对水位降低和氮添加的响应[J].植物生态学报,2014,06:619-625.
[19]陈明强.新中国结婚证书的图像研究[D].中央美术学院,美术学,2013,硕士.
[20]刘新.农村小学教师阅读现状的调查研究[D].山东师范大学,课程与教学论,2013,硕士.
[21]谢亚鹏.判别分析在上市公司信用风险度量中的应用[D].吉林大学,数量经济学,2004,硕士.
[22]董西露.巴恩斯的科学知识社会学:对库恩相对主义的继承与发展[D].湖南师范大学,科学技术哲学,2014,硕士.
[23]吕青.基于PDPP3T聚合物光电特性以及ZnO薄膜表征技术的研究[D].北京交通大学,2014.
[24]郭希娟,张涛,奚风丰.一种共轴混联机构的运动学分析[J].机械工程学报.
[25]黄群.《爱妻》中第三空间的文化身份[D].四川外国语大学,英语语言文学,2014,硕士.
[26]李阳,任鹏刚,许勐璠.隔离结构石墨烯-多壁碳纳米管/超高分子量聚乙烯导电复合材料阻温特性[J].化工新型材料,2015,03:58-60+99.
[27]熊丽君.基于GIS的非点源污染研究[D].河海大学,城市资源与环境,2004,硕士.
[28]陈祎淼.19项石墨烯检测标准正式实施[N].中国工业报,2014-08-28A03.
[29]刘耀强.Bcl-2家族成员在莱菔硫烷抑制人涎腺腺样囊性癌移植瘤中的作用[D].河北医科大学,口腔临床医学,2014,硕士.
[30]张薇薇.IrNi/C燃料电池氢阳极催化剂的研究[D].重庆大学,化学,2014,硕士.
[31]吴松.基于微圆环法的失效概率计算基本原理及其应用研究[D].合肥工业大学,机械电子工程,2013,硕士.
[32]马磊.大连市社区武术发展现状及对策研究[D].辽宁师范大学,体育教育训练学,2012,硕士.
[33]刘灿婷.当代大学生马克思主义民族观教育的实证研究[D].安徽大学,思想政治教育,2014,硕士.
[34]杨奕纯.H公司人力资源管理改进研究[D].云南大学,高级管理人员工商管理(EMBA),2012,硕士.
[35]王咏,申瑞民.采用构造后缀树方法的在线挖掘浏览模式[J].计算机工程,2004,19:126-128.
[36]沈静铭.基于分布式压缩感知的视频编解码技术研究[D].大连海事大学,电子与通信工程,2013,硕士.
[37]刘姝媛.硫化氢促血管新生机制研究[D].复旦大学,生理学,2012,博士.
[38]陈天翼.山东省高等教育财政支出与经济增长关系的实证研究[D].山东财经大学,财政学,2013,硕士.
[39]吴建繁,徐伟勇.长图记录的数字图象识别与拼接[J].冶金自动化,1995,03:23-27.
[40]汪力.上市公司可转换债券融资问题分析[D].西南财经大学,工商管理,2003,硕士.
[41]王钰.试论香港基本法解释权的有限性[D].华东政法大学,法律(专业学位),2012,硕士.
[42]胡春燕.数据库AES加密在电子病历系统中的应用研究[D].湖南大学,计算机技术,2012,硕士.
[43]嵇奎虎.多天线接收机中的盲均衡研究[D].南京邮电大学,通信与信息系统,2013,硕士.
[44]李玉中,王庆锁,钟秀丽,任娜.羊草草地植被-土壤系统氮循环研究[J].植物生态学报,2003,02:177-182.
[45]沈万岳.绿色建筑技术和绿色建材在高校建筑中的应用研究[D].西安建筑科技大学,建筑与土木工程,2013,硕士.
[46]张婷婷.基于统计分类的高炉煤气系统调度单元确定[D].大连理工大学,控制理论与控制工程,2013,硕士.
[47]菅培辰.基于公共治理视角下的我国食品安全监管的对策研究[D].内蒙古大学,公共管理,2014,硕士.
[48]陈功.肿瘤相关基因启动子甲基化和人脑胶质瘤临床预后相关性研究[D].复旦大学,神经外科学,2013,博士.
[49]陈立君.山东省循环经济发展的技术创新激励机制研究[D].山东财经大学,西方经济学,2012,硕士.
[50]范维1,2,张咚咚2,张彧1,姜铁民2,陈历俊1,2*.马克斯克鲁维酵母对发酵乳中糖代谢的影响[J].食品科学.

- 下一篇: 基于MPS的自动化综合实验系统设计
- 上一篇: 一种基于麦克风阵列的声源定位系统及其应用研究
相关推荐
- 好莱坞科幻电影意识形态研究
- 12月17日
- BFRP筋海砂混凝土梁受弯性能试验研究
- 06月02日