基于支持向量机和决策树的电信通信数据分析与应用

基于支持向量机和决策树的电信通信数据分析与应用

作者:师大云端图书馆 时间:2020-10-03 分类:参考文献 喜欢:1958
师大云端图书馆

【摘要】现代通信技术的高速发展以及移动智能终端的普及,使得人们对电信业务质量的要求越来越高,电信运营商可以通过提升业务质量来赢得用户资源,业务的用户体验是制定高效提升业务质量策略的依据之一。获取用户体验的传统方式有用户满意度调查问卷、业务满意度打分、随机用户语音回访等,很难得到准确全面的用户感知。测量报告由基站控制器采集,其数据客观地反映了全网的无线环境,从微观角度反映了终端的“感受”。用统计方法分析测量报告得到的用户体验比较直观、简单且片面,更多的是一种表象;用数据挖掘方法应用于测量报告可以得到不可预知的用户体验,具有现实意义和应用价值。从测量报告中挖掘到用户通话的真实体验,根据用户体验定位影响因素,实时优化无线网络提升通话质量,反过来提升用户体验。本文将挖掘用户体验的问题转换成预测分类问题,使用支持向量机和决策树多分类方法来解决。支持向量机(SVM)是当今机器学习中解决分类问题的重要方法之一,基于统计学习理论、最优化算法和核方法,具有全局优化、泛化能力强、避免“维数灾难”等优点,其优势在于小样本、高维数据的模式识别。决策树(DT)是一种预测模型,代表的是对象属性与对象值之间的一种映射关系,具有易于理解和快速分类等优点。由于测量报告数据量大,使用单一的支持向量机多分类方法会存在训练时间长、分类精度低、预测速度慢等缺点,于是本文结合决策树的结构特点,构造了一种新的基于支持向量机和决策树的多分类方法。新方法首先将一个多分类问题分解为多个二分类问题,针对每个二分类问题使用支持向量机解决,然后根据相异度来决策参与本次SVM训练的正负两类,本次SVM训练结束后,正负类合并成新的类簇参与下一次相异度计算,迭代上述过程直到所有类合并成一个类簇。这种方法生成的分类器模型结构是一棵二叉决策树。本文立足于SVM的理论基础、分析了DT的结构特点,研究了基于支持向量机和决策树多分类方法在电信数据上的实现及应用。主要工作包括:首先,仔细分析了测量报告数据的数据特点,进行了详细的数据预处理,包括数据清理、数据归约、数据归一化,并根据接收信号电平和接收信号质量对测量报告数据进行了类别划分。然后,在研究过程中发现,基于支持向量机和决策树的多分类方法存在错误累积和局部最优解等问题,往往使分类准确率下降,分类效果变差。仔细分析了其产生错误累积原因后,提出了基于哈夫曼树的支持向量机多分类方法,该方法有效减少了错误累积的同时也避免了局部最优解。最后,使用测量报告数据集对普通的SVM多分类方法、基于偏态树的SVM多分类方法和基于哈夫曼树的SVM多分类方法分别进行了实验验证。实验结果表明,新的方法在分类速度和分类精度上较传统的支持向量机多分类方法优越。仔细分析实验结果后,针对不同的分类结果,提出了相应的网络优化方法。
【作者】胡俊;
【导师】滕少华;
【作者基本信息】广东工业大学,计算机应用技术,2014,硕士
【关键词】决策树;支持向量机;相异度;哈夫曼树;测量报告;接收信号质量;接收信号电平;

【参考文献】
[1]秦建成.三峡库区土地利用变化的生态警戒值研究[D].西南农业大学,土壤学,2004,硕士.
[2]郭建邦.光折变光子晶格中离散空间孤子的特性研究[D].中国科学院研究生院(西安光学精密机械研究所),光学,2012,硕士.
[3]袁万.基于2.5维有限元饱和土地基中隔振沟屏障性能研究[D].浙江大学,岩土工程,2013,硕士.
[4]王莉.HT-7中性束注入装置监控系统的研究[D].合肥工业大学,流体机械及工程,2004,硕士.
[5]魏晓东.DCS的评价与选择[J].冶金自动化,1994,05:3-7.
[6]马成林.高档箱包革的研究——牦牛皮擦色包件革的开发[J].中国皮革.1995(08)
[7]赖晓文,陈启鑫,夏清,赵翔宇,杨明辉,张健.基于SVG技术的电力系统可视化平台集成与方法库开发[J].电力系统自动化,2012,16:76-81.
[8]李兆平.超高转差异步电机用于游梁式抽油机的节能机理[J].油田地面工程.1989(02)
[9]林池墨.史丹利公司与金正大公司财务绩效、财务政策及财务战略的比较研究[D].厦门大学,工商管理,2014,硕士.
[10]马竹梧.中国钢铁工业协会钢铁工业信息及自动化推进中心年会在上海举行[J].冶金自动化,2002,04:67-68.
[11]薛文科.企业人力资源管理系统设计与实现[D].山东大学,软件工程(专业学位),2012,硕士.
[12]闻嘉.含有WW结构域的氧化还原酶的基因对人骨肉瘤细胞MG-63的生长抑制的作用及机制[D].郑州大学,骨科,2013,硕士.
[13]于杨龙.弯坡连续刚构桥收缩徐变影响机理研究[D].长安大学,建筑与土木工程(专业学位),2014,硕士.
[14]丁远雷.锂离子电池高安全电解液系统的研究与应用[D].苏州大学,凝聚态物理,2014,硕士.
[15]林杰.面向移动视觉搜索的紧凑聚合描述子研究[D].北京交通大学,2014.
[16]施恺.电力改革形势下杭州电力多经企业战略研究[D].浙江工业大学,2012.
[17]杨乃平.统计数据失真与基层统计工作的完善[D].安徽大学,公共管理,2012,硕士.
[18]张文辉,祖元刚,马克明.裂叶沙参与泡沙参种群分布格局分形特征的分析[J].植物生态学报,1999,01:32-35+37-40.
[19]王春明.杰弗瑞·斯托莱特交互电子音乐作品研究[D].上海音乐学院,作曲与作曲技术理论,2014,博士.
[20]卢家玉.双氢青蒿素抑制人结肠癌HCT116细胞增殖和诱导凋亡的实验研究[D].广州中医药大学,中医外科学(专业学位),2013,硕士.
[21]肖浩,刘博阳,湾世伟,赵玉才.全光纤电流互感器的温度误差补偿技术[J].电力系统自动化,2011,21:91-95.
[22]谢文辉.输出理论下改写训练在大学英语写作教学中的实证研究[D].山西师范大学,外国语言学及应用语言学,2013,硕士.
[23]李倩.基于非采样Contourlet变换和图论的医学图像分割[D].山东大学,计算机应用技术,2013,硕士.
[24]朱科.基于可视化在线网损统计分析系统的设计与实现[D].电子科技大学,软件工程(专业学位),2012,硕士.
[25]曹冠华.深部岩体分区破裂形成机制的模型试验与分析研究[D].山东大学,岩土工程,2013,硕士.
[26]商利宏.基于复数ICA的MGDM系统信号分离技术研究[D].吉林大学,通信与信息系统,2013,硕士.
[27]李宝顺,顾春霞,包亚萍,李义丰.一种基于图像单应性矩阵的投影仪标定方法[J].安徽大学学报(自然科学版).
[28]陈志军,严海宇,蓝国钧,刘化章.助催化剂对Fe_(1-x)O基氨合成催化剂性能的影响[J].工业催化,2013,05:41-45.
[29]曹维.非高斯随机分布系统的故障诊断与最小熵容错控制[D].郑州大学,控制理论与控制工程,2013,硕士.
[30]周会琴.医学专科院校校园文化建设实证研究[D].安徽大学,公共管理,2012,硕士.
[31]刘允芬,张宪洲,张谊光,周允华.西藏高原田间冬小麦旗叶光合作用研究[J].植物生态学报,1999,06:521-528.
[32]张秉忱,宋启林,赵锡清,郭功俭,苏迎夫.2000年我国城市化道路的若干问题[J].经济纵横.1988(11)
[33]李云霞.石墨烯负载铂及非铂合金催化剂研究[D].重庆大学,2011.
[34]高毅.经阴道B超和宫腔镜对异常子宫出血诊断价值的研究[D].苏州大学,妇产科学,2014,硕士.
[35]邵阳.数字媒体终端监测客户端软件的设计与实现[D].华中科技大学,计算机技术,2013,硕士.
[36]丁奇.n条路的笛卡尔积图的匹配排除和条件匹配排除[D].兰州大学,应用数学,2014,硕士.
[37]张家铭.邵阳东部地区城乡一体化发展研究[D].广西师范大学,公共管理(专业学位),2013,硕士.
[38]沈峰.视点稀疏且可旋转的多透视视频拼接[D].安徽大学,计算机应用技术,2014,硕士.
[39]高伟.斜风作用下大跨度桥梁颤振导数研究[D].西南交通大学,桥梁与隧道工程,2013,硕士.
[40]黄世元.老挝沙耶武里省公务员福利保障制度研究[D].广西民族大学,行政管理,2013,硕士.
[41]耿红娟.低温溶解体系中纤维素薄膜与凝胶的制备、结构与性质研究[D].齐鲁工业大学,制浆造纸工程,2014,硕士.
[42]王坤.当代中国社会中间阶层的发展与全面建设小康社会[D].吉林大学,社会学,2004,硕士.
[43]宋立焘.当前中国城市更新运行机制分析[D].山东大学,行政管理,2013,硕士.
[44]张少平.接触网电参数测试方法[J].电气化铁道.1999(04)
[45]陈栋.基于VaR的上市商业银行竞争力评价体系研究[D].对外经济贸易大学,金融学,2004,硕士.
[46]王群.通货膨胀下的企业盈亏计量研究[D].河北大学,会计,2014,硕士.
[47]黄庆达.三种鲤科鱼类代谢率异速尺度的研究[D].西南大学,水生生物学,2014,硕士.
[48]曲伟.中国电力行业的专利信息分析研究[J].图书情报工作,2014,S1:167-170.
[49]张宁.定制型A改装汽车企业生产运营管理合理化研究[D].首都经济贸易大学,企业管理,2014,硕士.
[50]郑志东.内置竖向型钢SRC中高剪力墙受力性能有限元分析[D].重庆大学,建筑与土木工程(专业学位),2014,硕士.

相关推荐
更多