基于K近邻的多标签学习方法研究

基于K近邻的多标签学习方法研究

作者:师大云端图书馆 时间:2025-06-03 分类:硕士论文 喜欢:509
师大云端图书馆

【摘要】样本分类一直是数据挖掘领域的研究热点,传统的样本分类是单标签分类,这类样本只与单个标签相关,然而现实生活中的样本往往同时属于多个范畴,对这类样本的处理被称为多标签学习问题。由于多标签数据的特殊性,使得传统的分类方法无法直接对其进行处理,因此人们相继提出了多种方法用于处理多标签数据分类,这些方法总体来说可以分为两类:基于问题转化的方法与基于算法转化的方法。基于问题转化的方法将多标签数据通过某种转换策略转换成单标签数据,然后利用单标签分类方法来进行处理。基于算法转化的方法则是通过改进已有的单标签数据分类方法,使其能直接用于多标签数据分类。本文主要研究基于K近邻多标签学习方法,主要完成的工作内容如下:1:对于已有的懒惰型多标签学习方法:一种新型的多标记懒惰学习方法,该方法在构建样本近邻集时对于每个样本都选取相同个数的近邻点,这种取样本近邻点的方法没有充分考虑样本分布特点。本文针对这一缺点提出改进,将粒计算思想融合到该方法中,提出基于粒计算的多标签懒惰学习方法,该方法在构建样本近邻集时充分考虑样本分布特点,通过粒度控制,动态选取不同样本的近邻点个数,使得构建的样本近邻集中的样本具有较高的相似性,从而改进算法效果。在给出改进方法后,本文对改进方法与原方法进行了实验对比,对比结果表明改进的方法在总体上要优于原方法。2:对于已有的基于随机游走模型的多标签学习方法:一种基于随机游走模型的多标签分类方法,该方法构建的随机游走图是将所有有相同标签的样本点都连接起来,导致随机游走图中边数过多,从而随机游走达到收敛的过程较复杂,从而导致算法复杂性过高。本文将机器学习领域的随机游走图与K近邻方法相结合,提出基于K近邻与随机游走模型的多标签学习方法,该方法首先对训练集中的每个样本点找到其K个近邻点,构建基于训练集的KNN图,然后基于每个测试样本与已构建的KNN图都构建一个基于KNN的随机游走图,在该图上进行随机游走过程,得到一个稳定的概率分布向量,通过该向量得到该测试样本拥有各个标签的概率值,最后给出与该方法对应的阈值选择方法,得到对应的阈值向量,对比测试样本具有各个标签的概率值与其对应的标签阂值来确定测试样本是否具有该标签。分析表明,通过将K近邻方法与随机游走图相结合,有效的降低基于随机游走模型的多标签分类方法的时间复杂度。最后给出本文的工作总结与将来研究工作的展望。
【作者】余强;
【导师】赵海峰;
【作者基本信息】安徽大学,计算机应用技术,2014,硕士
【关键词】分类;多标签;K近邻;粒计算;随机游走;阈值选择;

【参考文献】
[1]石娉娉.卞之琳新诗理论研究[D].扬州大学,文艺学,2012,硕士.
[2]邢春玲.板带温变形热处理工艺与性能研究[D].燕山大学,机械设计及理论,2013,硕士.
[3]乔军委.融合电动助力转向的主动转向系统的研究[D].河南科技大学,车辆工程,2013,硕士.
[4]朱艳冬.194例原发性胆汁性肝硬化患者的临床分析[D].吉林大学,内科学,2014,硕士.
[5]陈德琳.基于旅游资源可达性的公路网络优化方法研究[D].哈尔滨工业大学,交通运输规划与管理,2013,硕士.
[6]李虎.甘肃东部齐家文化时期考古遗址木炭遗存分析[D].兰州大学,自然地理学,2013,硕士.
[7]陈翼帮.单胺类神经递质高灵敏分析方法研究[D].湖南师范大学,化学工程(专业学位),2013,硕士.
[8]边博.中国农村居民消费的阶段性差异研究[D].西北师范大学,统计学,2013,硕士.
[9]胡培莉.遗产继承中若干问题研究[D].华东政法大学,法律(专业学位),2012,硕士.
[10]张峰,周广胜.中国东北样带植被净初级生产力时空动态遥感模拟[J].植物生态学报,2008,04:798-809.
[11]刘一飞.基于Zone协议的FCoE网络访问控制的设计与实现[D].哈尔滨工业大学,软件工程,2014,硕士.
[12]石彦杰.结核性脑膜炎脑脊液细胞学及易感基因(TLR2 T597C)的研究[D].南方医科大学,神经病学,2012,硕士.
[13]袁晓洁,王祥瑞,张海威,牛丽萍.知识发现中一种变化趋势模型的算法研究[J].南开大学学报(自然科学版),2005,02:42-48.
[14]姜雪松.基质金属蛋白酶-3基因Lys45Glu多态性与缺血性卒中亚型的相关性[D].青岛大学,神经病学,2013,硕士.
[15]王靖宇.重大工程项目社会稳定风险评估机制研究[D].吉林大学,公共管理,2013,硕士.
[16]王璐珏.河北省植被净初级生产力遥感估算[D].河北师范大学,地图学与地理信息系统,2012,硕士.
[17]黄晓梅.氧化石墨烯与纳米氧化铁复合物的制备及性能研究[J].广东化工,2012,02:22-23+21.
[18]刘玉娟.强阻尼波动方程及粘弹性方程的高效有限元分析[D].郑州大学,计算数学,2013,硕士.
[19]牛玲华.拟常曲率空间中具有常平均曲率的紧致超曲面[D].山西师范大学,基础数学,2013,硕士.
[20]张英楠.miR-10a通过靶定基质金属蛋白酶14(MMP14)参与结肠癌转移的调控[D].天津医科大学,病原生物学,2007,硕士.
[21]田俊杰.“勇”的视域下孔门五大弟子的形象变迁[D].西南大学,中国古代文学,2014,硕士.
[22]邱金波.基于实时操作系统的汽车车身控制系统设计[D].湖南大学,软件工程,2011,硕士.
[23]彭浩洋.IGFBP7基因多态性与结直肠癌发病风险的关联研究[D].河北医科大学,外科学,2014,硕士.
[24]何松晟.基于能量方法的岩体破坏机理及其在边坡工程中的应用[D].武汉工业学院,岩土工程,2012,硕士.
[25]李印思.基于OpenGL的三维交互建模技术及其应用[D].西安电子科技大学,机械设计及理论,2012,硕士.
[26]王百志.丹红对ST段抬高型急性心肌梗死PCI术后心肌无复流的影响及其机制的探讨[D].青岛大学,急诊医学,2013,硕士.
[27]吴昊.基于Android的实名火车票检票终端设计与实现[D].华东交通大学,控制理论与控制工程,2013,硕士.
[28]甘文秘.我国律师事务所中特殊的普通合伙制度研究[D].华中科技大学,法律,2013,硕士.
[29]宋玉美,刘陈,游小杰,郭希铮,王江波.HX_D2C型电力机车辅助变流系统实时仿真研究[J].机车电传动,2014,01:21-25.
[30]那春霞.预算特点对管理者业绩影响的实证研究[D].东北大学,会计学,2010,硕士.
[31]戴亮.工程项目内部控制[D].上海交通大学,会计,2013,硕士.
[32]余世孝,宗国威,陈兆莹,臧润国,杨应承.随机与系统取样的生态学信息量比较[J].植物生态学报,1998,05:90-94+96-97.
[33]赵进杰.河北省第十六届大运会健美操比赛难度动作分析[D].河北师范大学,运动训练,2012,硕士.
[34]陈路.大负载球形气浮轴承设计及流场特性的数值模拟研究[D].哈尔滨工业大学,机械电子工程,2013,硕士.
[35]樊敏.论新闻舆论对政府行为的监督[D].华中师范大学,行政管理,2003,硕士.
[36]来存良.创建学习型企业走金光大道[J].管理科学文摘.2002(08)
[37]柳新元,张晒.国内学术界关于自由与平等关系之争的研究综述[J].湖北行政学院学报,2014,01:91-96.
[38]张伟.光伏方阵户外测试系统的研究[D].中国科学院研究生院(电工研究所),电力电子与电力传动,2004,硕士.
[39]李响.福建省技术创新效率及其影响因素分析[D].华侨大学,区域经济学,2014,硕士.
[40]杨景明,连家创,王洪瑞,方一鸣.铝带冷轧机板形冷却控制系统剖析[J].冶金自动化,1995,03:12-15.
[41]阴艳廷.利率市场化对我国城商行盈利能力的影响及应对[D].山东财经大学,金融学,2014,硕士.
[42]赵连玮.左西孟旦对老年慢性充血性心力衰竭患者的疗效及安全性研究[D].河北医科大学,内科学,2014,硕士.
[43]李觅佳.基于不良天气因素影响下山区高速公路事故多发点鉴别[D].长安大学,交通工程,2014,硕士.
[44]犹爽.大连海上机场工程对金州湾海域水环境影响数值研究[D].大连理工大学,港口、海岸及近海工程,2013,硕士.
[45]记者王璐.谁能堵住券商“黑嘴”?[N].金融时报,2011-06-04007.
[46]胡宗波.某车型底盘架构后悬架子系统优化设计研究[D].上海工程技术大学,车辆工程,2014,硕士.
[47]徐贝贝.文化大繁荣视域下我国经济转型研究[D].山东大学,马克思主义基本原理研究,2013,硕士.
[48]周明磊,游小杰,王琛琛,王剑,李强.电流谐波最小PWM开关角的计算及谐波特性分析[J].中国电机工程学报,2014,15:2362-2370.
[49]陆乃炎.基于Android平台的施工项目成本信息管理系统研究[D].中国矿业大学,工程管理,2014,硕士.
[50]杨中军.不同组合力量训练方法对篮球运动员下肢爆发力的影响研究[D].北京体育大学,体育教育训练学,2013,硕士.

相关推荐
更多