基于多视图的半监督学习分类算法的研究

基于多视图的半监督学习分类算法的研究

作者:师大云端图书馆 时间:2021-03-22 分类:参考文献 喜欢:3712
师大云端图书馆

【摘要】机器学习作为计算机学科领域的热门研究方向一直备受关注。在过去,机器学习主要采取的学习方法为有监督的学习和无监的督学习,目标数据集一般针对类标号齐全的训练集和完全无类标号的训练集,数据属性集的维度一般不高。但是,随着近年来对机器学习的技术不断地研究,数据采集技术也得到了飞快的发展,采集到的数据属性维度变多、属性之间相关度变高,再加上有类标号的数据较少,无类标号数据飞速增加,所以面对当今的数据集传统的机器学习方法已经不能进行有效的学习,如何利用这些数据进行高效的机器学习并促进其在各行业中的发展成为了一个引人深思的问题。因此能够结合大量无无类标号数据和少量有类标号数据的半监督学习方法应运而生。近几年来,随着机器学习和数据挖掘中各种技术的不断发展,半监督学习也在理论和实际应用中得到了提升。半监督学习的研究侧重关注在训练集中大部分数据的类别信息缺失的情况下,如何训练能够训练得到学习性能良好的学习器。半监督学习过程主要是通过使用少量有类标号数据集和大量无类标号数据设计出性能良好的学习器。半监督学习中朴素贝叶斯分类器被广泛使用,因为其具有简单,快速,高效等优点。多视图训练方法是半监督学习中的重要方法,该方法训练时将数据属性集划分成多个属性子集,根据每个子集生成分类器,分类器之间相互提供新数据共同学习。然而多视图训练中过程尚存在着一些问题有待解决:一是如何从无类标号数据集中选择置信度高的数据进行标记并加入到有类标号数据集当中。二是,上述选择数据时各分类器如何选择合适数据量的数据。由于传统的多视图半监督分类算法没有考虑各个分类器的性能,每次迭代选择相同数量的数据进行添加类标号,使得各个分类器不能发挥其所长达不到分类的最佳效果。本文针对以上问题,给出了两种置信度的评估方法:基于K邻近与最大差距置信度的评估方法,给出了两种方法的计算公式,并且在UCI数据集上选取了一定比例的数据进行了实验,分别对比了宏平均召回率、宏平均精度还有所用时间,证明了基于最大差距置信度方法的有效性。随后提出了一种新的权重调节的两视图半监督分类算法,改进了传统的两视图半监督学习分类算法,新算法中每次根据两分类器的分类性能,将无类标号数据添加到有类标号数据集中,这种方法可以发挥单个分类器的个性,性能好的分类器将会向有类标号数据集添加更多高置信度的数据。性能差的分类器将会向有类标号数据集添加更少的低置信度的数据。实验结果标明新算法的确可以在宏平均召回率与宏平均精度上有所提高。
【作者】孙鹏;
【导师】董立岩;
【作者基本信息】吉林大学,计算机软件与理论,2014,硕士
【关键词】半监督学习;多视图学习;集成学习;朴素贝叶斯;分类;

【参考文献】
[1]王海萍.针刺对正常及游离肠管大鼠空肠MMC不同时相肠电和肠运动的影响[D].湖北中医药大学,针灸推拿学,2014,博士.
[2]朴美英.过敏性紫癜患儿血清白三烯B4水平及治疗的临床分析[D].吉林大学,临床医学,2013,硕士.
[3]程翼宇,范骁辉,瞿海斌.论建立与发展中药信息学[J].中国中医药信息杂志,2003,02:84-86+92.
[4]艾振华.FoxM1剪接异构体FoxM1b参与乳腺癌细胞多西紫杉醇耐药的机制研究[D].第四军医大学,肿瘤学,2014,硕士.
[5]卢胜利.开关磁阻电机系统的故障诊断方法研究[D].中国矿业大学,2010.
[6]张磊.可组装曲柄群驱动装置的研究与开发[D].陕西科技大学,机械设计及理论,2013,硕士.
[7]蔡潜,蔡秋霞,庄桂林,钟兴,王新德,李小年,王建国.脱质子化1,3环加成石墨烯外在固定位上的贵金属纳米线(英文)[J].物理化学学报,2014,04:640-645.
[8]裴媛媛.绵羊equatorin(赤道素)的cDNA克隆、原核表达、抗体制备及在顶体反应前后精子中的定位[D].内蒙古大学,生物工程,2014,硕士.
[9]周全.硅基有机光电单层膜的构筑[D].浙江大学,材料物理与化学,2004,硕士.
[10]王海涛.不确定广义双线性系统的保性能控制[D].东北大学,运筹学与控制论,2010,硕士.
[11]席俊红.基于案例推理的科技文献推荐系统研究[D].华东师范大学,2005.
[12]郑伟.松南气田营城组火山岩气藏描述[D].东北石油大学,地质工程(专业学位),2013,硕士.
[13]柴洪.文昌A凹陷恩平组沉积相研究[D].中国矿业大学,矿产普查与勘探,2014,硕士.
[14]冯新豹.基于.NET的学生资助管理系统的设计与实现[D].吉林大学,软件工程,2014,硕士.
[15]李宇环.台湾亚热带云雾林碳通量模拟[D].华东师范大学,环境科学,2013,硕士.
[16]冯卫.一种新型机电缓速器的研究[D].湖南大学,机械制造及其自动化,2011,硕士.
[17]林姗.益气解毒方联合核苷类抗病毒药治疗慢性活动性乙型肝炎的临床观察[D].广州中医药大学,中医内科学(专业学位),2013,硕士.
[18]朱婧妍.基于观测器的时滞随机系统的滑模变结构控制[D].哈尔滨工业大学,计算数学,2014,硕士.
[19]王伟.桥式起重机智能快速设计系统的研究与实现[D].济南大学,机械制造及其自动化,2012,硕士.
[20]张楠,夏禾.铁路桥梁在高速列车作用下的动力响应分析[J].工程力学,2005,03:144-151.
[21]王晓珺.J集团公司资金管理系统的设计研究[D].华东理工大学,项目管理,2013,硕士.
[22]赵定东.整合中的社会沟通与“安全阀”的社会效用[D].吉林大学,社会学,2004,硕士.
[23]李贺军,薛晖,付前刚,张雨雷,史小红,李克智.C/C复合材料高温抗氧化涂层的研究现状与展望[J].无机材料学报,2010,04:337-343.
[24]张鸿宾,孙广煜.Tabu搜索在特征选择中的应用[J].自动化学报,1999,04:29-38.
[25]张琳琳.序约束下β-ARCH模型的极大似然估计[D].吉林大学,概率论与数理统计,2004,硕士.
[26]蒋兴.探析光影元素在中国水墨人物画中的运用[D].西安美术学院,美术学,2014,硕士.
[27]张新.(N,N’-间二羧基苯基)对苯二甲二胺配合物的合成、结构及性能研究[D].西北大学,无机化学,2013,硕士.
[28]韩玉乾.伊恩·麦克尤恩小说《星期六》中的凝视、反抗和移情[D].华中师范大学,英语语言文学,2013,硕士.
[29]田丽娜.苹果分级检测算法的研究[D].陕西科技大学,模式识别与智能系统,2013,硕士.
[30]俞凤.爱之灵药:《爱药》中美国原住民生存出路探寻[D].华中师范大学,英语语言文学,2014,硕士.
[31]姚莉莉.论信息公开与信息安全之平衡[D].复旦大学,新闻学,2012,硕士.
[32]方琴芬.顾客满意度测评方法研究[D].合肥工业大学,2006.
[33]夏岩峰.中联重科信用销售系统进度管理研究[D].吉林大学,项目管理,2014,硕士.
[34]王银.11~13~(+6)周胎儿严重心脏畸形产前超声诊断研究[D].南方医科大学,影像医学与核医学,2012,硕士.
[35]钟丽芳.雷公藤免疫抑制活性单体筛选及对HL-7702细胞毒性研究[D].福建中医药大学,药物分析学,2013,硕士.
[36]吴敏.纳米材料修饰电化学传感器及其在有害物质检测中的应用研究[D].华东师范大学,2014.
[37]杨雪华.带有积分边值条件的高阶奇异脉冲微分方程的正解[D].曲阜师范大学,应用数学,2013,硕士.
[38]盛桐.纳米TiO_2/粉煤灰微珠复合光催化剂的制备及性能优化研究[D].合肥工业大学,2013.
[39]邓飞.财政补贴与农业上市公司社会绩效的相关性研究[D].重庆工商大学,会计学,2014,硕士.
[40]王芳.关于我国扩大增值税征收范围改革的研究[D].山西财经大学,财政学,2013,硕士.
[41]刘娜.预付卡发行中的告知义务研究[D].首都经济贸易大学,法律(专业学位),2014,硕士.
[42]赵力.英语教师课堂言语行为的分析[D].东北农业大学,英语语言文学,2013,硕士.
[43]宿晓丹.从人权保障的角度论刑事侦查权的司法控制[D].东北大学,宪法学与行政法学,2010,硕士.
[44]丁鹏.基于VB的加热炉余热锅炉水循环计算软件开发[D].东北大学,热能工程,2010,硕士.
[45]吕文军.基于Android系统的多媒体框架的应用扩展[D].哈尔滨工业大学,信息与通信工程,2013,硕士.
[46]杨灵.2012高考英语(湖南卷)完形填空测试的构念效度实证研究[D].湖南师范大学,课程与教学论,2013,硕士.
[47]阴彦辉.徐淮山羊H-FABP基因克隆及转基因小鼠和转基因羊的制备[D].扬州大学,动物遗传育种与繁殖,2012,硕士.
[48]陈慧娟,朱建君,余萌.葡萄糖氧化酶在石墨烯-纳米氧化锌修饰玻碳电极上的直接电化学及对葡萄糖的生物传感[J].分析化学,2013,08:1243-1248.
[49]贾洪.我国建筑业市场结构及其优化研究[D].北京交通大学,2010.
[50]檀姗姗.论空间在《道林·格雷的画像》叙事中的重要性[D].河北师范大学,英语语言文学,2014,硕士.

相关推荐
更多