自适应多趟聚类算法在无线网络数据中的研究与应用

自适应多趟聚类算法在无线网络数据中的研究与应用

作者:师大云端图书馆 时间:2020-10-03 分类:参考文献 喜欢:2238
师大云端图书馆

【摘要】数据挖掘是指从数据库中发现隐含的、新颖的、对决策有潜在价值的知识和规则的过程,已经在许多领域得到了广泛的应用。聚类分析是数据挖掘领域最为重要的技术之一,在理论和方法上都取得了丰硕的研究成果。无线网络数据是电信数据的重要组成部分。来源于我国某区域的用户语音通话信息,包含用户标识、通话质量等属性,这些属性属性共同决定了用户的通话质量。文中对无线网络数据的研究,着眼于用户语音状况,寻找提高企业服务质量的方案,助其因地制宜地为用户提供优质服务。无线网络数据集规模庞大,适于数据挖掘的研究,而聚类算法处理后的数据,用户记录被分为多个簇,簇内的相似度较高,簇间的相似度较低。针对具体簇内的信息,结合簇间差异性,得出聚类结果并分析。根据数据集特征,选择合适的聚类算法对结果至关重要。当今的聚类算法,根据各自的特性,可以划分为若干类。每种聚类算法都有自己的适用范围,在实际应用中,需要根据具体数据集选择聚类算法。KSummary聚类算法能够较好的处理分类属性及混合属性数据集。该算法提出用摘要信息表示一个簇,对分类属性的处理方法,相比用取值频率最高的属性值来代表整个属性值的取值方法,摘要信息的表示方法偏差更小,特别是在不同取值频度差异不大的情况。但是该算法还存在一些缺点:当数据规模达到一定程度时,聚类个数K难以确定;算法对初值敏感;初始聚类中心选取不当,算法易陷入局部最优解。本文提出使用自适应多趟聚类分析方法对KSummary方法进行改进,针对KSummary算法在聚类个数及初始聚类中心选择上的问题,引入层次和密度聚类,对数据集进行多趟聚类。第一趟,层次聚类用以确定聚类个数k;第二趟,密度聚类用以获得较准确的初始聚类中心点;第三趟,迭代重定位,处理数据用以得到最终聚类结果。通过在数据集上的实验结果和分析表明,自适应多趟聚类的分析方法有效地克服了KSummary算法的缺点,并且能够得到稳定、收敛、精度更高的结果。最后,将自适应多趟聚类分析方法应用于无线网络数据集。影响通信质量的因素有很多,为了更准确的分析出上行信息与下行信息在这些因素中的重要性,将两者分开,获得两个数据集,分别对两个数据集进行聚类。分析两个聚类中簇的信息,交叉比较两个聚类结果中特性相近的簇,得出实验分析图表,分析这种现象的原因,企业据此设置合适的基站布局。
【作者】洪源;
【导师】滕少华;
【作者基本信息】广东工业大学,计算机应用技术,2014,硕士
【关键词】聚类;KSummary算法;初始聚类中心;自适应层次聚类;密度聚类;

【参考文献】
[1]曹越.基于LED用掺铕钼酸盐红色荧光粉研究[D].西安电子科技大学,材料物理与化学,2012,硕士.
[2]肖斌.染料分子共价功能化石墨烯的制备、光生电子传递及其光催化产氢性能研究[D].苏州大学,2014.
[3]叶林华.组织部干部管理信息系统设计与实现[D].西南交通大学,计算机软件与理论,2013,硕士.
[4]胡斯敏.FT公司基于自工序完结的质量管理方法研究[D].天津大学,工程管理,2013,硕士.
[5]刘志.岳麓区幼儿园教师美术素养的调查研究[D].湖南师范大学,学前教育(专业学位),2013,硕士.
[6]马波.我国高校图书馆全面质量管理体系构建研究[D].东北大学,行政管理,2010,硕士.
[7]吴华英.钢支撑框架抗侧力性能试验研究及有限元分析[D].武汉理工大学,结构工程,2003,硕士.
[8]颜怀超.眉山职业技术学院成绩分析系统的设计与实现[D].电子科技大学,软件工程(专业学位),2012,硕士.
[9]秦艳妮.内部控制质量与企业价值的相关性研究[D].天津财经大学,会计学,2012,硕士.
[10]李鲲.香港地域性观演空间设计探究[D].清华大学,建筑学,2013,硕士.
[11]阚兰艳,郑冰娜,高超.石墨烯模板法制备超薄二氧化硅纳米片[J].科学通报,2012,22:2062-2065.
[12]高长花.石斛合剂通过GLP-1/β-Catenin信号通路促进胰岛细胞增殖的分子机制研究[D].福建中医药大学,中西医结合基础,2014,硕士.
[13]季宁.W证券公司核心业务流程再造[D].兰州理工大学,工商管理,2013,硕士.
[14]李莎.云南省社会保障卡发行服务管理系统开发[D].电子科技大学,软件工程(专业学位),2012,硕士.
[15]李冰锐.吉林动漫集团发展战略研究[D].吉林大学,工商管理,2012,硕士.
[16]吴红斌,蔡亮.可再生能源分布式发电系统的经济调度[J].农业工程学报,2010,12:287-292.
[17]丁凌风.健康风险视角下大学生医疗保险制度研究[D].南京农业大学,社会学,2011,硕士.
[18]闫晔.草原碳汇定价研究[D].内蒙古农业大学,农业经济管理,2014,博士.
[19]夏前亮.声表面波传感器测试电路研究[D].南京航空航天大学,测试计量技术及仪器,2013,硕士.
[20]李莹莹.城市失能老人社区照顾的研究[D].山东大学,社会工作(专业学位),2013,硕士.
[21]周圆.制造企业内部生产物流配送研究[D].云南财经大学,工商管理,2013,硕士.
[22]杜兆旻.云南特色城市化模式研究[D].云南财经大学,区域经济学,2013,硕士.
[23]刘鹏.石墨烯和氧化铜复合材料的制备及电容性能研究[D].上海大学,2013.
[24]钟晓云.围产期感染沙眼衣原体MOMP基因裂解酶片断长度多态性研究[D].重庆医科大学,儿科学,2004,硕士.
[25]章琢之.师范生教学实践能力评价研究[D].华东师范大学,课程与教学论,2002,硕士.
[26]彭潇.基于Ajax的企业网络故障在线报修系统的设计与实现[D].电子科技大学,软件工程(专业学位),2012,硕士.
[27]高文杰.吉林市综合交通调查及分析[D].长安大学,交通运输工程(专业学位),2014,硕士.
[28]郑淑梅.Probe和Spectrum后处理法对肝脏占位~1H-MRS的影响[D].大连医科大学,影像医学与核医学,2012,硕士.
[29]朱晓云.我国通用航空安全管理体系建设研究[D].西南大学,公共管理(专业学位),2014,硕士.
[30]丁奕.基于列车节能的时刻表制定方法研究[D].北京交通大学,控制工程(专业学位),2013,硕士.
[31]王恒刚.转向架参数台运动平台的姿态检测[D].吉林大学,载运工具运用工程,2013,硕士.
[32]刘思.水下整平器施工关键技术在疏浚工程中的应用研究[D].天津大学,水利工程,2013,硕士.
[33]谭绍满,丁海,罗人深,苏勇.马尾松红锥混交林现状分析与评价[J].植物生态学报,1997,06:84-93.
[34]周娟娟.辣椒秧和马铃薯秧青贮调制研究[D].甘肃农业大学,草地生物多样性,2013,硕士.
[35]吴瑾,赵燕平.WEB数据挖掘中多线程的开发及同步机制的实现[A].中国电子学会核电子学与核探测技术分会、中国核学会核电子学与核探测技术分会.第11届全国计算机在现代科学技术领域应用学术会议论文集[C].中国电子学会核电子学与核探测技术分会、中国核学会核电子学与核探测技术分会:,2003:6.
[36]陈静蓉.石墨烯及金属纳米材料在电化学生物传感器和有机污染物检测中的新应用[D].西南大学,2014.
[37]崔介君.花生壳中黄酮成分的研究[D].浙江工业大学,2004.
[38]余永虎.房地产税对房价的影响效应[D].南京大学,产业经济学,2013,硕士.
[39]周莉.百瑞源枸杞产业发展有限公司品牌战略研究[D].宁夏大学,农业经济管理,2014,硕士.
[40]王振亚.POST2000客户关系管理系统[J].中国邮政,2001,11:24-25.
[41]金希.残疾人平等就业权的法律保护[D].宁波大学,经济法学,2014,硕士.
[42]董广辉.基于SAP的唐山不锈钢公司财务系统的设计与实现[D].燕山大学,软件工程,2014,硕士.
[43]李宝臣.鹅细小病毒VP3基因的克隆、序列比较及原核表达[D].东北农业大学,预防兽医学,2003,硕士.
[44]王婉湘.一种基于一类支持向量机的时序异常检测算法[J].微型机与应用,2005,01:55-57.
[45]孙霞芳.DZ大学后勤集团公司财务管理模式研究[D].电子科技大学,工商管理(专业学位),2013,硕士.
[46]佟纯厚,韩安荣.近代交流调速——第五讲脉宽调制(PWM)型变频器[J].冶金自动化,1991,06:46-50.
[47]白承娟.中国利用外资问题研究——兼析韩国对华投资战略[D].对外经济贸易大学,国际贸易,2004,硕士.
[48]赵伟立.100A/1200V Si JBS的设计与参数优化[D].杭州电子科技大学,电子与通信工程,2013,硕士.
[49]曹务祥,张慕刚.滑动扫描谐波分析[J].石油地球物理勘探,2005,05:27-31+37+144+15.
[50]江宝林,张川,申展,葛家翔,胡运发.基于互关联后继树的Web日志挖掘技术[J].计算机应用与软件,2004,05:9-11+112.

相关推荐
更多