基于k-tuple频度统计的微生物群落测序数据分析

基于k-tuple频度统计的微生物群落测序数据分析

作者:师大云端图书馆 时间:2020-01-08 分类:硕士论文 喜欢:2418
师大云端图书馆

【摘要】微生物群落样本的比较,即Beta多样性,是生态学研究中的重点研究问题。新一代测序技术使得直接从许多微生物群落中测取大量的宏基因组和宏转录组的短读段序列成为了可能。因为微生物群落中基因组的数量和序列通常是未知的,且基因组的测序覆盖率较低,要对短读段从头组装则很有挑战性,也因此传统的基于配准的序列比对方法并不适用于微生物群落的比较中。另一方面,基于k-tuple频度的非配准方法在宏基因组样本的比较中产生了很理想的结果,让我们看到了它的应用前景。但是,基于k-tuple频度的非配准方法对于宏转录组样本的比较是否有效却还是未知的,并且最有效的相异度度量方法也需要探寻。本文基于k-tuple频度,将几种Beta多样性的度量方法应用在宏转录组数据上来评估它们在宏转录组样本聚类上的有效性,包括三种d2类型的相异度度量、CVTree中的相异度度量Hao、基于相对熵的S2以及3种经典的范式距离。实验结果表明ds2相异度度量方法在宏转录组样本聚类上的性能最优,包括不同测序深度下对测序样本进行群组划分的能力、揭示环境梯度的影响、区分宏基因组和宏转录组样本、以及对测序误差的鲁棒性。本文也对k-tuple长度和马尔科夫模型阶次的影响进行了研究,并开发相应的分析软件来实现本文主要的分析流程。本文还对基于k-tuple频度的序列特征方法进行了延伸性的探究,通过三组实验研究序列特征方法对相似的微生物群落样本、相似物种和不同测序平台的测序数据所表现出来的聚类特性。实验发现RNA样本要比DNA样本容易被区分,同时也发现序列特征方法的测序平台敏感度高、对复杂群落样本的聚类效果差。此外,本文还初次尝试将k值设为30到40之间,得出了初步的结果。基于k-tuple频度的序列特征方法应用限制少,能够有效揭示宏转录组样本间的主要组间差异和梯度变化关系,且相异度度量方法有鲁棒性好、性能优良的ds2。但序列特征方法依然存在它的局限性和不足,有待进一步改进。
【作者】刘麟;
【导师】王颖;
【作者基本信息】厦门大学,系统工程,2014,硕士
【关键词】k-tuple频度;微生物群落;相异度度量;

【参考文献】
[1]李可心.高等职业学校艺术类专业人才培养模式的研究[D].吉林农业大学,职业技术教育学,2014,硕士.
[2]裴玉哲.球面渐开线非圆锥齿轮产形线切齿法的研究[D].吉林大学,机械制造及其自动化,2014,硕士.
[3]汪萌萌.农村高中生偶像崇拜现象研究[D].南京师范大学,教育学原理,2012,硕士.
[4]陈延杰.锡林浩特市城市扩展与土地可持续利用研究[D].内蒙古师范大学,土地资源管理(专业学位),2012,硕士.
[5]廖融.我国保障性住房有限产权的缺陷及完善[D].首都经济贸易大学,民商法学,2013,硕士.
[6]周伟.中药方剂核心药物及其配伍规律挖掘[D].南京大学,计算机软件与理论,2013,硕士.
[7]王海红,赵伟.无缝钢管水淬设备控制系统的设计与实现[J].一重技术.2007(06)
[8]林靖博.通用型自动变速箱总成测试系统的设计与实现[D].烟台大学,电子与通信工程,2014,硕士.
[9]张玲娜.电子工艺与检测课程改革研究[J].电子制作,2015,13:179-180.
[10]林经伟.构建外汇管理信息化平台为体制改革保驾护航[J].金融电子化,2005,02:16-20.
[11]梁伟.神经组织工程修复支架材料的制备及其相关基础研究[D].第四军医大学,外科学,2004,硕士.
[12]尚连勇.一种铝合金的成分组织及性能研究[D].兰州理工大学,材料工程,2013,硕士.
[13]张伟.对于H.264/AVC视频编码中快速运动估计和模式选择技术的研究[D].山东大学,计算机软件与理论,2013,硕士.
[14]蔺霄.信息技术与中师数学教学整合研究[D].西北师范大学,教育,2003,硕士.
[15]陈伟.关于普及列检“三大件”模式的探讨[J].中国铁路.1995(11)
[16]黄元龙,张德武.传感器材料[J].传感器世界.1996(11)
[17]张涛.全光照蔬菜育苗箱的设计与应用研究[D].河南农业大学,设施栽培,2012,硕士.
[18]范穗强.加味柴胡桂枝汤合并文拉法辛治疗中重度抑郁症的回顾性研究[D].南方医科大学,中西医结合临床,2012,硕士.
[19]张冬梅.LOX-1及细胞外HSP60在小胶质细胞介导的神经炎症及神经损伤中作用的研究[D].复旦大学,生物化学与分子生物学,2012,博士.
[20]来琢.基于网格的神经计算平台资源分配的设计与实现[D].浙江大学,计算机应用,2004,硕士.
[21]曲惠廷.间充质干细胞向胰岛素分泌细胞分化的调控及应用基础研究[D].山东大学,内科学,2014,博士.
[22]晴帅.外商直接投资对老挝经济发展的影响[D].广西师范大学,区域经济学,2013,硕士.
[23]董岩.油画肖像画肌理运用效果研究[D].西南交通大学,美术学,2013,硕士.
[24]刘琪瑶.我国农村居民最低生活保障制度运行中的问题研究[D].吉林大学,行政管理,2013,硕士.
[25]王瑶.《文学书官话》(Mandarin Grammar)研究[D].南京师范大学,语言学及应用语言学,2012,硕士.
[26]周美华.“做中学”科学教育探究[D].杭州师范大学,课程与教学论,2006,硕士.
[27]刘靖,陈福生,张勤.基于粗糙集和模糊集的属性约简算法[J].计算机工程与科学,2005,02:42-44.
[28]李海燕,付群.国产大型六辊冷轧机简介[J].一重技术.2006(06)
[29]马利帅.桦褐孔菌中多糖类和甾体类化合物的构效关系研究[D].天津大学,生药学,2013,硕士.
[30]王维.某高校学生管理信息系统就业工作管理子系统设计与实现[D].电子科技大学,软件工程(专业学位),2012,硕士.
[31]杨燕.肖邦与希曼诺夫斯基的玛祖卡舞曲对比研究[D].湖南师范大学,音乐学,2014,硕士.
[32]王洋.高校语言文字规范化调查与研究[D].湖南师范大学,汉语言文字学,2013,硕士.
[33]艾彦方.矿山技术经济研究中应重视的若干问题[J].化工矿山技术.1985(04)
[34]王蕾.葫芦岛农电企业财务管理的问题及对策[D].东北大学,工商管理,2009,硕士.
[35]俞江明.基于图割的深度图像分割研究[D].宁波大学,计算机应用技术,2013,硕士.
[36]于天宇.罗尔斯顿生态哲学思想研究[D].吉林大学,马克思主义基本原理,2014,硕士.
[37]张欢聚.论奈保尔《自由国度》中人物的文化身份[D].河北师范大学,英语语言文学,2013,硕士.
[38]王展.超声与机械方法联合破解剩余污泥机制的研究[D].东北大学,流体机械及工程,2010,硕士.
[39]肖丕楚.传统优势企业转型研究[D].四川大学,2005.
[40]徐京.基于DPI的电信业务监控系统的分析与设计[D].北京邮电大学,信息安全,2013,硕士.
[41]周莹.1000MW机组汽轮机数字电液调节系统建模与仿真[D].华北电力大学,控制理论与控制工程,2012,硕士.
[42]王铮.维瓦尔第声乐作品的实践探析[D].西安音乐学院,声乐演唱(专业学位),2014,硕士.
[43]曹海燕.情境教学与小学口语交际研究[D].内蒙古师范大学,学科教学(专业学位),2013,硕士.
[44]胡红梅.高校哲学社会科学课的思想政治教育功能研究[D].西南大学,思想政治教育,2013,硕士.
[45]翁丽丽.环境规制对中国发电行业效率的影响研究[D].北京交通大学,2014.
[46]孙晓静,刘维宁,张宝才.浮置板轨道结构在城市轨道交通减振降噪上的应用[J].中国安全科学学报,2005,08:65-69+114.
[47]陈江玲.企业社会责任对顾客忠诚的影响研究[D].湖南师范大学,企业管理,2013,硕士.
[48]贺鑫平.基团保护法1,3-二氯丙烯制备1,3-丙二醇工艺研究[D].浙江大学,化学工程,2004,硕士.
[49]徐良齐.地震作用下楔体滑坡的稳定性分析[D].重庆大学,建筑与土木工程(专业学位),2014,硕士.
[50]周博宇.纺织品和食品塑料包装材料中三氯生检测方法的建立及应用研究[D].吉林大学,劳动卫生与环境卫生,2014,硕士.

相关推荐
更多