降维和SVM相结合的方法在基因数据中的研究

降维和SVM相结合的方法在基因数据中的研究

作者:师大云端图书馆 时间:2018-09-13 分类:参考文献 喜欢:3574
师大云端图书馆

【摘要】支持向量机作为分类的一个有效的工具,在近些年来取得了快速的发展,是上世纪90年代Vapnik提出的。支持向量机在其提出的时候,就开始受到了人们的广泛关注,并且凭借其自身良好的推广能力和泛化能力,受到了全世界各国研究者的一致好评和追捧。支持向量机是在统计学习基础下根据结构风险最小化原则提出的一种新的机器学习工具,作为一种重要的工具在处理高维小样本问题时显示出了极其强大的优势。随着支持向量机的不断发展,近年来在实际生活和工作领域中的应用也越来越广泛。在生物信息学的发展,通过制备的基因芯片可以得到所谓的基因表达谱数据,基因表达谱数据的典型特点是样本数目比较少,基因数目相对较高。基因表达谱数据在临床应用中越来越广泛,该数据在日常的临床医学肿瘤癌症诊断,及其正常患病样本的区分有着广泛的应用。降维作为一种重要的特征提取的工具,在处理高维数据的时候,显示出其强大的力量,能够有效地解决高维数据处理时带来的维数灾难等问题。降维按照处理方式不同分为:全局降维和局部降维。线性降维和非线性降维。通过对数据进行降维处理可以提取出高维数据在低维空间的本质的特征,提取出高维数据的本质特征之后,对数据进行分类处理。通过降维方法对数据处理,能够降低数据的维数,同时减小数据计算的时间复杂性,而且降维之后的数据去除了数据中存在的冗余信息,能够提高数据处理的精度。降维作为一种有效的数据处理方法在现实生活中处理高维数据越来越广泛,随着数据量的不断增加,降维的作用显得越来越重要。通过降维之后,能够提取出数据的本质特征,结合支持向量机分类,可以达到减少时间复杂性和提高精度的目的。本文首先对研究的基因表达谱数据做了简要的介绍,对这种数据的研究方向和发展趋势做了说明。然后简要介绍了基因芯片技术的特点以及用于肿瘤分类的基本流程。最后对基因表达谱数据的处理过程,其中包括特征是如何选择,特征的提取情况,以及分类器的分类情况做了分析,这里主要介绍了降维和分类的方法的优势。本文的工作主要如下:1.对基因表达谱数据进行分析,找出跟疾病有关的最少特征基因,并用一个较好的分类器进行分类预测。采用新的改进的记分准则RFSC去除分类无关基因;2.采用降维技术对“小样本,高维数”的基因表达谱数据进行特征提取,降低数据的维数,同时提高数据处理的精度,减少处理时间;3采用降维和分类相结合的处理手段,提高了实验的精度。并且能够有效的区分正常样本和患病样本;
【作者】王颖;
【导师】杨可新;
【作者基本信息】吉林大学,软件工程,2014,硕士
【关键词】支持向量机;噪声;基因表达谱;肿瘤分类;基因选择;降维;

【参考文献】
[1]顾超.肾性甲状旁腺功能亢进患者术后低钙血症的预测及早期治疗[D].苏州大学,普外科(专业学位),2014,硕士.
[2]颜传武.虚拟手操作力觉生成及评价研究[D].浙江理工大学,机械设计及理论,2014,硕士.
[3]赵琦.稻壳砂浆复合墙板静力试验研究及有限元模拟分析[D].哈尔滨工业大学,工程力学,2013,硕士.
[4]张学全.石墨烯的功能化及其光电性能研究[D].天津大学,2011.
[5]于文卓.中国高速公路投融资模式研究[D].吉林大学,财政学,2013,硕士.
[6]周进,HisakoTACHIBANA,李伟,刘贵华.受损湿地植被的恢复与重建研究进展[J].植物生态学报,2001,05:561-572.
[7]范接鹏.多目的地地图的简化及布局优化方法研究[D].厦门大学,计算机技术,2014,硕士.
[8]李悦.基于“山水城市”概念下的小城镇城市设计研究[D].合肥工业大学,建筑设计及其理论,2011,硕士.
[9]程战利.生物除磷颗粒污泥的培养驯化及性能[D].哈尔滨工业大学,市政工程,2014,硕士.
[10]赵玲玲.信息不平等相关问题研究[D].黑龙江大学,图书馆学,2013,硕士.
[11]费倩男.复杂环境硫酸盐侵蚀混凝土微观试验研究[D].西安建筑科技大学,结构工程,2013,硕士.
[12]吴迪.去分化脂肪细胞与脂肪干细胞成骨及成软骨能力的比较研究[D].遵义医学院,骨外科,2012,硕士.
[13]涂亮.创伤应激对大鼠Walker-256移植瘤生长及增殖活性的影响研究[D].南方医科大学,外科学,2012,硕士.
[14]贾知青,庄菁.时态模式数据挖掘在金融领域的应用[J].石油大学学报(社会科学版),2004,05:26-29.
[15]裴晋昌,石伟明,张经纶.深色服装革扎染工艺[J].中国皮革.1995(05)
[16]李姗姗.炭石墨材料的制备及其抗氧化性能的研究[D].湖南大学,材料学,2011,硕士.
[17]董龙.汽车正面碰撞乘员约束系统仿真与稳健优化方法研究[D].浙江大学,2014.
[18]张金英.低碳经济政策就业效应的理论解析与实证研究[D].北京交通大学,2013.
[19]王小草.政务资讯·瓯海区[J].今日科技,2012,08:37.
[20]赵静.高精度音圈电机的多场分析与驱动器硬件设计[D].太原科技大学,检测技术与自动化装置,2014,硕士.
[21]姚晴晴.沪深300股指期货套期保值比率研究[D].山东大学,概率论与数理统计,2013,硕士.
[22]杨卫明.五四时期工读互助团的教育探索简论[D].福建师范大学,教育史,2004,硕士.
[23]王千峰.我国快递企业强势品牌建设研究[D].首都经济贸易大学,产业经济学,2014,硕士.
[24]刘文辉.基于燕尾突变的车辆脱轨研究[D].西南交通大学,车辆工程,2014,硕士.
[25]朱涟.南京郊区城市化与农民市民化研究[D].四川农业大学,农村与区域发展(专业学位),2012,硕士.
[26]王苏林.山区高速公路多隧道路段线形安全性评价研究[D].重庆交通大学,道路与铁道工程,2012,硕士.
[27]林雪芳.培养学生发现并提出问题能力的研究与实验[D].福建师范大学,教育,2003,硕士.
[28]黄逸民.基于多Agent的智能管理信息系统理论与应用研究[D].浙江大学,2002.
[29]雷磊.县级政务公开研究[D].郑州大学,行政管理,2013,硕士.
[30]陈琴.贝叶斯数据挖掘技术及其在反垃圾邮件中的应用[D].广西大学,2004.
[31]赖敏.由反问句引起的冲突性回应的语用研究[D].广东外语外贸大学,外国语言学及应用语言学,2013,硕士.
[32]曹卿.明日叶查尔酮对2型糖尿病大鼠红细胞胰岛素受体亲和力的影响[D].青岛大学,营养与食品卫生,2013,硕士.
[33]祁国柱.新课程改革背景下高中数学有效教学之高三有效备考的研究[D].华中师范大学,学科教学,2013,硕士.
[34]曾涛.逆向物流信息系统的设计与实现[D].燕山大学,计算机技术,2014,硕士.
[35]余江.体育活动对大学生持续VDT作业所致脑力疲劳的恢复效果[D].杭州师范大学,体育教育训练学,2013,硕士.
[36]陈宁,沈晓瑜,桂卫华,郭宇骞.关联量化系统参数稳定性与控制器设计[J].自动化学报,2014,01:41-50.
[37]黄兴.从元代人物画题材看元代绘画的隐逸思想[D].吉林大学,美术,2013,硕士.
[38]李红梅.六轴义齿雕刻机自动编程系统关键技术研究[D].北方工业大学,机械电子工程,2013,硕士.
[39]肖德铭.汉语“A一量,B一量”构式的ECF模型研究[D].四川外国语大学,英语语言文学,2014,硕士.
[40]赵宇.非免疫缺陷宿主肺隐球菌病临床分析及乳胶凝集试验的诊断价值[D].南方医科大学,内科学,2012,硕士.
[41]王夏薇.老年恒河猴颈动脉粥样硬化性狭窄模型的建立[D].广西医科大学,神经病学,2013,硕士.
[42]童华军.CDMA系统中小波包多载波调制的性能分析及仿真[D].天津大学,通信与信息系统,2004,硕士.
[43]尹琦卿.基于节奏的鼓声识别[D].山东大学,信号与信息处理,2013,硕士.
[44]洪显利.组块构建记忆策略训练,提高高一学生英语词汇学习质量的实验研究[D].西南师范大学,2001.
[45]王辉.CK6136数控车床交流伺服进给系统的分析与仿真[D].浙江工业大学,2009.
[46]李丹阳.商业银行信贷与经济周期关联性研究[D].中国矿业大学,金融工程与风险管理,2014,硕士.
[47]吴金钟,赵玉芹,苏震.TSC就地动态无功功率补偿装置在安钢的试验研究与应用[J].冶金自动化,2002,02:26.
[48]巩文学.高校大学生价值观错位及对策研究[D].山东大学,思想政治教育,2012,硕士.
[49]林建海.相似度计算在科技项目管理系统中的研究及应用[D].杭州电子科技大学,计算机应用技术,2014,硕士.
[50]苟宇.行为资产定价理论与实证研究[D].西南财经大学,2005.

相关推荐
更多