蛋白组学中串联质谱定性多肽算法研究

蛋白组学中串联质谱定性多肽算法研究

作者:师大云端图书馆 时间:2015-11-20 分类:毕业论文 喜欢:3536
师大云端图书馆

【摘要】串联质谱已成为蛋白质组研究不可或缺的分析手段,但如何分析由其产生的高通量数据却是巨大的挑战,特别是提高蛋白质序列库搜索定性多肽结果的准确度和速度。本论文基于对大量高质量质谱的数据挖掘,尝试提出新的方法来解决这一问题。为此,本论文对以下两方面内容进行了研究。第一方面为多肽质谱数据挖掘,由第二至第四章组成。在第二章中,本论文对脯氨酸效应在低能量碰撞诱导裂解(CID)多肽质谱中的裂解行为进行研究。通过对大量包含脯氨酸的多肽质谱的数据挖掘,绘制出了脯氨酸的裂解行为图,发现脯氨酸的N端肽键在多肽裂解过程中为优先断裂的位点,形成高丰度的质谱峰。但其受多肽所带的电荷,氨基酸组成,及脯氨酸在多肽中的位置等因素影响,并且与其它多肽裂解途径如天门氨酸效应,yN-2-b2效应等形成竞争。脯氨酸裂解行为图的研究拓展了对脯氨酸在低能量CID中的裂解规律的认识,提供了脯氨酸N端肽键在不同多肽中发生选择性裂解的概率。这种模式也为之后由数据挖掘大量质谱来预测多肽质谱打下了基础。第三章中本论文对新近证实的多肽杂排离子进行研究。由于其在质谱预测以用于蛋白质序列库搜索的过程中并没有被考虑,因此其是否会影响多肽定性结果成为关注的焦点。为此,本论文首先对杂排离子在低能量CID质谱中的分布及可能的裂解规律进行数据挖掘,发现其普遍存在于多肽质谱中,形成的质谱峰个数占质谱峰总数的10%以上,但强度低于基峰的20%。对其裂解规律的挖掘发现无主导其裂解的规律。这些发现大大丰富了对杂排离子的认识。然后,本论文采用三种多肽定性策略的五种定性算法对来自不同仪器的包含和未包含杂排离子的质谱进行定性。通过比较和分析定性结果,发现杂排离子在某种程度上会对定性结果产生影响,而其影响方式则是干扰算法在质谱预处理过程中对y,b等序列离子的提取,从而影响多肽质谱匹配得分。但若采用有效的质谱预处理方法或稳健的打分算法,则可以有效消除该影响。对杂排离子广泛的研究揭示了这些新证实离子在质谱中的存在方式及其对多肽定性的影响,为下一章质谱预测提供非常有价值的信息。在第四章中,本论文开发基于数据挖掘技术的pepMSPredictor算法对多肽碎片离子质谱进行预测。pepMSPredictor根据多肽竞争裂解模型将多肽的裂解分成了不同裂解途径,并提取每一裂解途径所产生的碎片离子强度作为单独的数据集,采用不同变量集对这些碎片离子进行描述。利用二叉树将每一数据集分成多个区域之后,对每一区域或多个区域建立随机梯度助推树回归模型。最后将不同裂解途径的预测结果进行合并组成多肽的预测质谱。通过标准蛋白质混合物质谱数据的测试表明pepMSPredictor可准确地预测多肽质谱,且具有良好的扩展性,即对其它仪器产生的质谱数据依然具有很高的准确性。第二方面为质谱数据预处理方法的开发。由于高通量质谱数据中存在大量不可解释质谱及蛋白质序列库搜索过程中因需要穷举不同母离子电荷而带来的重复搜索使定性结果中的大部分为错误定性结果,导致正确定性结果难以被有效提取出来。因此需要消除那些干扰质谱。本论文为得到有效的质谱过滤方法,首先对质谱峰提取方法进行全面研究,获得了较优的质谱峰提取方式。另外,本论文提出由简化的理论同位素分布来检测实际质谱中的同位素分布以消除这些同位素峰。对真实数据的测试表明该方法具有良好的性能。在上述两种质谱峰预处理方法的基础上,本论文对高通量质谱进行质谱质量评估消除不可解释质谱,并对母离子电荷进行预测以降低搜索结果的空间。为使模型可应用于不同数据体系,本论文提取了大量的变量来对质谱进行描述,并采用线性判别分析(LDA)方法对这些数据体系分别建立质谱质量评估和电荷预测模型。通过大数据集的测试,所建立的质谱质量评估模型可有效消除会产生错误结果的质谱而保留绝大部分可被正确定性的质谱。若将质谱质量评估模型和电荷预测模型相结合,则可消除60%以上的错误定性结果而保留90%以上正确定性结果。这表明本论文所开发的模型具有良好的实用性和可靠性。
【作者】董乃平;
【导师】梁逸曾;
【作者基本信息】中南大学,分析化学,2013,博士
【关键词】蛋白组学;数据挖掘;多肽定性;串联质谱;质谱预处理;

【参考文献】
[1]李显阳.并联混合动力汽车模式切换动态协调控制的仿真研究[D].北京交通大学,2014.
[2]赵欢.脉冲电弧液电放电压载水处理效果的研究[D].华中科技大学,高电压与绝缘技术,2013,硕士.
[3]范伶俐.热带太平洋—印度洋相互作用的年代际改变及机理研究[D].南京气象学院,气象学,2003,硕士.
[4]汪从文.建构主义指导下的计算机辅助几何教学研究[D].华东师范大学,教育,2001,硕士.
[5]邵贝贝.我国A股上市公司高管变更与盈余管理关系的实证研究[D].安徽大学,财务管理,2014,硕士.
[6]黄伟.基于电压控制区的主导节点电压校正方法[D].河海大学,电力系统及其自动化,2004,硕士.
[7]何丽.系列基于poly(MAA-co-EDMA)整体柱复合分离材料的制备及性能分析[D].重庆大学,2014.
[8]葛玲云.我国石油企业海外并购财务风险控制研究[D].山东大学,会计(专业学位),2013,硕士.
[9]薛昊昕.我国股市动量效应和反转效应规律探究[D].厦门大学,金融,2014,硕士.
[10]于立红.新农村建设中农村家庭道德问题及对策研究[D].哈尔滨理工大学,思想政治教育,2012,硕士.
[11]赵妮.副词与助动词共现相关格式句法语义特征研究[D].北京大学,汉语言文字学,2013,硕士.
[12]慎涵.一种基于PCM的文件系统设计与实现[D].华中科技大学,计算机技术,2013,硕士.
[13]李卫.全球化背景下爱国主义教育探析[D].吉林大学,思想政治教育,2013,硕士.
[14]彭彦.IL-18在原核细胞和真核细胞中的表达和纯化[D].重庆医科大学,组织胚胎学,2004,硕士.
[15]阴知见.sp~3键合的金刚石与氮化硼多型第一性原理研究[D].燕山大学,材料物理与化学,2013,硕士.
[16]董繁麟,刘加龙,王玉岭.用地震方法勘探河道砂岩体[J].石油地球物理勘探,1981,05:41-47.
[17]祁文举.论期货交易所的法律地位[D].中国政法大学,经济法学,2004,硕士.
[18]李敏.动漫图片质量评价研究[D].厦门大学,计算机软件与理论,2014,硕士.
[19]李丛.统筹城乡社会保障发展的小城镇政府能力建设[D].上海工程技术大学,社会保障,2012,硕士.
[20]刘平.GATS框架下保险业市场准入制度探析[D].湖南师范大学,国际法学,2004,硕士.
[21]李妙鱼.碳纳米纤维膜为载体直接甲醇燃料电池阳极催化剂的研究[D].山西大学,2011.
[22]付兴.风雨荷载共同作用下高压输电塔的动力反应分析及风洞试验研究[D].大连理工大学,建筑与土木工程(专业学位),2013,硕士.
[23]黄丹.中国单口相声语篇主位模式给对外汉语口语语篇教学的启示[D].厦门大学,语言学及应用语言学,2014,硕士.
[24]郭积程.高速铁路路基上有砟轨道与无砟轨道过渡段研究[D].北京交通大学,2009.
[25]夏小虎.有源逆变和正弦调制策略的研究[D].合肥工业大学,电力电子与电力传动,2003,硕士.
[26]沈龙大,李崇坚.轧机交流调速传动的现状和动向[J].冶金自动化,1992,02:8-13+60.
[27]黄科元,刘静佳,黄守道,廖武,易韵岚.变流器开路故障下永磁直驱风电系统运行分析[J].电力系统自动化,2014,14:23-29.
[28]邹璐.井冈山自然保护区32个树种抗火性研究[D].江西农业大学,森林保护学,2012,硕士.
[29]梁韬.基于Py-GC/MS的半纤维素热裂解机理研究[D].浙江大学,工程热物理,2013,硕士.
[30]卞向娟.面向制造业ERP的数据仓库支持决策的研究[D].昆明理工大学,2004.
[31]何伟.星形共聚物PLLA-ESO结晶性能的研究[D].江苏科技大学,2012.
[32]郁扬.人口老龄化对福州市新型农村合作医疗住院基金影响的研究[D].福建医科大学,社会医学与卫生事业管理,2014,硕士.
[33]李媛.军队技术院校大学生职业心理现状研究[D].第四军医大学,应用心理学,2004,硕士.
[34]赵莹.基于LTE-A的中继选择策略及资源调度算法研究[D].哈尔滨工业大学,信息与通信工程,2013,硕士.
[35]夏振业.李达经济哲学思想研究[D].湖南师范大学,马克思主义哲学,2014,硕士.
[36]刘素涛.河北师范大学农村体育教育硕士现状调查研究[D].河北师范大学,学科教学,2014,硕士.
[37]郭环.弹性梁方程边值问题的可解性[D].山东师范大学,基础数学,2013,硕士.
[38]李莉.SCOOpenServer5.0.4新版本简介[J].铁路计算机应用.1997(05)
[39]纪昱交.口译大赛评估标准分析[D].吉林大学,翻译,2014,硕士.
[40]魏慧.对蕾切尔·卡森及其生态思想的研究[D].南京师范大学,英语语言文学,2012,硕士.
[41]张树交.EPCAM抗原负载DC诱导腺癌特异性免疫杀伤的实验研究[D].河北医科大学,外科学,2014,硕士.
[42]赵琳,王小旭,孙明,丁继成,闫超.基于极大后验估计和指数加权的自适应UKF滤波算法[J].自动化学报,2010,07:1007-1019.
[43]贺云鹏.项目经理视角下的建筑企业多项目资源冲突问题研究[D].西安建筑科技大学,工程经济与管理,2013,硕士.
[44]周特,刘振鹏,刘迅芳,张寿华.基于用户行为的Non-self集的构造方法[J].河北大学学报(自然科学版),2004,04:434-437.
[45]高海佳.中国和土耳其的少数民族文化政策比较研究[D].华中师范大学,社会学,2014,硕士.
[46]代红梅.卵泡液中促性腺激素平抑因子与IVF-ET的相关性分析[D].吉林大学,妇产科学,2013,硕士.
[47]张文武.地方出入境部门社会管理创新研究[D].西南交通大学,公共管理(专业学位),2012,硕士.
[48]吴双迟.MGF纳米微球静电纺丝材料对人骨髓间充质干细胞生物学行为的影响[D].重庆大学,生物医学工程,2014,硕士.
[49]何晓晓.江村沟垃圾渗滤液尾水的深度处理研究[D].长安大学,环境工程,2013,硕士.
[50]周迪.新疆工业能源效率研究[D].新疆财经大学,统计学,2013,硕士.

相关推荐
更多