三线性分解算法用于蛋白动态和多态体系中的研究

三线性分解算法用于蛋白动态和多态体系中的研究

作者:师大云端图书馆 时间:2015-06-01 分类:期刊论文 喜欢:1741
师大云端图书馆

【摘要】在最近的几十年,研究者手上拥有越来越多的仪器设备对客观对象进行更加深入的研究。毋庸置疑,分析化学家一次实验只能获得一个数据的时代一去不复返;而另一方面,单次实验所能获得的数据不但巨大,而且总量上依然在增长中。在化学及其交叉领域的研究中,非常需要一系列的高效工具来处理这些海量的数据。这正是化学计量学方法迅速发展的客观原因。研究者在分析化学的相关研究中,不但希望能获得充满物理/化学意义的定性信息,还希望能同时获得足够的定量信息来进行分析研究。经典的零阶校正无法处理系统中有相互干扰的情况;而一阶校正方法在白色体系中有出色的性能,然而在灰色、黑色系统中则效果一般。而基于三线性分解的二阶校正策略则具有唯一性以及“二阶优势”。二阶优势则能确保即使存在未知干扰的情况下,研究者依然能同时获得感兴趣组分的定性定量信息。本论文的实验部分将讨论三线性分解算法在动态和多态系统中的应用潜力,同时论述在理论方面如何通过基础算法理论研究来支持适应新体系、新情况的算法开发。(1)在第二章中,提出了一个具有原创性的算法分析工具——误差传递结构(errorTransmissionStructure,ETS)用以分析迭代型三线性分解算法的特性。ETS分析虽然推导过程复杂,却能够较清晰解释ATLD(AlternatingTrilinearDecomposition)和PARAFAC(ParallelFactorAnalysis)算法的特性,如收敛速度、超估计组分的敏感性、分辨结果的质量。相较之下,从拟合残差方面来研究算法,很难清楚解释算法的各个特性,因为无论组分数估计正确与否,该指标一般都是收敛的。在ETS的分析中能发现,组分数敏感的原因是由含有组分矩阵偏差的中间项所决定。PARAFAC算法的ETS中间项会在组分数超估计的条件下形成一个剧烈的摄动,在极接近客观解的位置形成高高的“城墙”阻止算法接近客观解。在组分数估计正确的情况下,ETS的最后一项显示出,在算法靠近客观解的时候,该项反而是增大的,说明了模型中的残差(含有干扰、噪声等非三线性成分)对结果的精度有一定的影响,但如果噪声水平不高则影响不大。如果组分数超估计,虽然算法在动态跟踪中的总体现象不大相同,在细节上却有一些相似的行为,这可能是开发统一的组分数估计方法的重要提示。而本章研究中发现的算法搜寻最优解的地形发生变化的现象,则直接促成了第三章从“解空间形状”入手的微分研究。(2)在第三章中将介绍基于矩阵微分分析的算法分析工具。矩阵微分分析可以清楚地阐明算法的优化策略,并且直观地判断解空间的情况。对各个算法的微分分析有助于梳理高效算法程序开发的思路。在微分分析结果中,如果算法的目标函数的形状是“凸”的,则对应的算法就对超估计组分数敏感;如果算法的目标函数的形状是“严格凸”的,则对应的算法对超估计组分数不敏感。本章提出的“解集”概念,进一步完善了关于三线性分解“唯一性与不唯一性”的理论。即使组分数超估计,客观解依然是在目标函数的可行解当中,并且有可能是全局最小。为什么有一部分算法能够在组分数超估计的情况下依然能到达客观解,而另外一部分则不能,微分分析和ETS都给出了有效的解答。(3)在第四章中将讨论对3-甲基吲哚的(MI)的荧光多态性的定量研究。MI是天然蛋白的重要内源信号部件,其荧光多态性使得它的光谱富含化学信息,然而其光谱的分析却非常具有挑战性。三线性分解方法则有可能胜任该复杂光谱的分析,并且提供对MI的氢键相互作用更加深入的理解。同时考虑激发与发射荧光光谱,并且构造成三维数据阵,最终利用ATLD算法进行定量分析,则有助于对MI的氢键作用进行原位的分析。首先,充分地利用实验收集到的激发光谱能包含充分的信息去分析覆盖在强作用背景下的弱相互作用。其次,三维数据阵的三线性分解具有唯一性可以保证计算得到的光谱具有实际的物理意义。最后,ATLD算法能够在不影响体系的复杂化学平衡的前提下,定量分辨出相互作用体系中各个荧光态对应的光谱,并最终对MI与其它分子的氢键相互作用进行有效的研究。细节的研究将利用MI的两个能量最低的激发单重态aLa和’Lb的荧光发射特性来进行详细的相互作用研究。’La和’Lb的荧光发射取决于MI与其它分子作用以及周围微环境的情况。从定量信息中计算出来的氢键作用参数与过往理论模拟工作的结果进行了有效的比较。(4)在第五章中尝试从稳态荧光信息中分离出时域的变化,并籍此来对α-chymotrypsin(CHT)的开关状态进行定量讨论。荧光探针ANS(1-anilinonaphthalene-8-sulfonate)具有两种状态,并且对应着两个不同的荧光激发-发射过程。激发-发射矩阵荧光光谱(EEM)能够记录ANS-CHT体系中的全部荧光信息,虽然它只是一个稳态的荧光技术。并且,将多个样本的EEM光谱数据构建成三维数阵经过三线性分解处理之后,可以提供对应于激发过程的激发光谱、对应于发射过程的发射光谱以及与这些时域过程对应的定量信息。因此,该思路不但可以讨论ANS的激发发射过程,并且能够对CHT的开关状态进行定量讨论。ANS的S1,ct态荧光对周围溶剂的微环境十分敏感,从而可以成为指示CHT活性的探针。本实验最终获得了ANS-CHT体系在相当宽的pH范围内的开关响应曲线。本研究提供了一种经济而且方便的用于研究蛋白状态改变的研究方案。(5)在第六章中,不同的三线性分解算法对多样品构成的LC-MS数据的适用性进行了详细的讨论。本测试研究中使用的是一套含有一个低丰度肽段LC-MS数据。基于双线性策略的方法并不能胜任处理这种含有低丰度信号的数据体系,并未能获得预期的数学分离效果。而目前常用的三线性分解算法亦不能直接用于LC-MS数据。其主要原因可能是由于一个化学物质的纯质谱图具有稀疏性:在有离子信号的质荷比(m/z)坐标上为一正值响应,而在其它位置为严格的0值。为了实现有效的具有物理化学意义的数学分离目标,本文作者提出了新的NNATLD算法(Non-NegativeAlternatingTrilinearDecomposition)。该新算法很好的适应了质谱数据的特性,并且节约计算资源,还具有收敛速度快的特性。(6)在第七章的研究着重讨论了LC-MS数据的内在联系,该联系在过去传统的研究工作中并未得到系统的重视。该内在联系是多线性关系,并且能用三线性、四线性甚至多线性分解进行高效处理。为了高效的处理LC-MS数据构成的三阶张量,本章使用了第六章中提出的新算法,该新算法能够同时获得定性定量结果。算法的分辨能力能够从数学分离的角度极大地提高色谱系统的峰容量,最终使得结合了“数学分离技术”的1D-LC系统的效果比常规的1D-LC系统花上数小时进行物理/化学分离的效果更好。由于三线性分解算法是根据组分的化学/物理意义进行信息分离的,因而能获得对应组分的纯质谱图,这点与传统的方法大为不同。该策略不但适用于高丰度对象,并且也适用于低丰度体系。新的数据处理策略另一个较为突出的特点是,该方案能够在获得定性信息的同时,获得体系的定量信息。因为新的研究策略能同时获得丰富的定性定量信息,因而能对蛋白组学的研究对象进行更加深入的研究。本研究采用了为人熟悉的HSA与胰蛋白酶的动态作用体系作为分析的对象。根据定性定量信息的挖掘结果,HSA各个部位不同的作用活性被清晰地呈现出来,该结果用常规的技术是很难获得的。
【作者】张树荣;
【导师】吴海龙;
【作者基本信息】湖南大学,分析化学,2014,博士
【关键词】化学计量学;三线性分解;动态体系分析;多态体系分析;蛋白质组LC-MS;误差传递结构;微分分析;

【参考文献】
[1]刘承军.首钢矿业烧结厂粉尘监测防治实现电子化管理与控制[J].冶金自动化,2008,03:69.
[2]武洋洋.带梁式转换层的高层建筑抗震性能分析及工程设计[D].西安建筑科技大学,建筑与土木工程,2013,硕士.
[3]虞宙.基于物联网平台的业务描述语言的研究[D].南京邮电大学,通信与信息系统,2013,硕士.
[4]郭乐之.经典通俗化与译者行为[D].扬州大学,外国语言学及应用语言学,2011,硕士.
[5]谭武英.LD配电网线损管理研究[D].华南理工大学,工业工程,2012,硕士.
[6]王振华,RODRIGUESM,THEILLIOLD,沈毅.离散时间线性时变系统的传感器故障估计滤波器设计(英文)[J].自动化学报,2014,10:2364-2369.
[7]刘英.中外政府采购法律制度之比较[D].山东大学,法律(专业学位),2013,硕士.
[8]张樨樨,张鹏飞,徐子轶.海洋产业集聚与海洋科技人才集聚协同发展研究——基于耦合模型构建[J].山东大学学报(哲学社会科学版),2014,06:118-128.
[9]杨克绳.从地震信息看中国推覆与滑覆构造[J].石油地球物理勘探,1996,02:248-256+308.
[10]牛忠远.我国物流需求预测的神经网络模型和实证分析研究[D].浙江大学,2006.
[11]夏斌.武汉理工大学数字化校园的安全性研究与实现[D].武汉理工大学,通信与信息系统,2004,硕士.
[12]胡俊飞.基于列存储的数据库物理层优化研究[D].华中科技大学,计算机软件与理论,2013,硕士.
[13]王晓玲.我国自然灾害治理研究[D].中国政法大学,公共管理(专业学位),2014,硕士.
[14]孙酣经.硅氟有机材料的发展现状和展望[J].塑料工业.1988(05)
[15]王晓涛.一个增量式粮食单位信息聚类分析系统和实现[D].吉林大学,2004.
[16]陆海佳.素质教育背景下的青少年法制宣传教育问题研究[D].上海社会科学院,法学,2012,硕士.
[17]滕予非,王锡凡,宁联辉,宋卓彦.分频输电系统交—交变频器触发脉冲实时生成方法[J].电力系统自动化,2010,23:76-81.
[18]秦喆.永磁同步电机的建模及控制方法研究[D].燕山大学,控制理论与控制工程,2014,硕士.
[19]王鹏.发电市场合约管理与机组组合问题研究[D].华北电力(北京)大学,2001.
[20]王婷婷.死亡率模型的拓展研究和中国人口死亡率的预测[D].浙江大学,统计学,2014,硕士.
[21]胡异.国内图书馆信息共享空间构建研究[J].农业图书情报学刊,2015,02:35-37.
[22]杨宁尹涛吕廷杰.九七工程需要系统升级[N].人民邮电,2003-03-06003.
[23]董晓丽.探究家庭结构调整背景下的幼儿品德养成策略[D].复旦大学,思想政治教育,2012,硕士.
[24]王兴.论金融动态监管——兼及对当前金融监管现状的思考[J].西南金融,2001,05:8-12.
[25]王能顺.机顶盒位置锁定与下载系统的设计与研究[D].湖北大学,微电子学与固体电子学,2012,硕士.
[26]周佳惠.性别话语转型下女性主体性研究[D].南京大学,社会学,2013,硕士.
[27]张冠男.多维话语理论视域下的电视求职类真人秀节目研究[D].华中科技大学,广播电视传播学,2013,硕士.
[28]朱履骅.后殖民批评在中国[D].苏州大学,比较文学与世界文学,2003,硕士.
[29]吕素青.黄土高原中东部典型地区空气花粉组合及其与气候因子的关系[D].河北师范大学,自然地理学,2013,硕士.
[30]洪彩玲.大跨度预应力空间钢结构施工过程分析与索力优化研究[D].郑州大学,结构工程,2013,硕士.
[31]陈年强,黄学茭.关于吸收高校青年知识分子入党的再思考[J].中国高教研究.2005(10)
[32]岳殿民.基于价值链理论的成本管理方法及应用研究[D].河北工业大学,2002.
[33]王汝林.开放体系含时密度泛函方法的发展和应用[D].中国科学技术大学,2014.
[34]孟祥龙.基于Ansys的混凝土搅拌运输车减速机的破坏机理研究[D].长安大学,机械设计及理论,2014,硕士.
[35]刘永耀.Excel数据导入Oracle数据库表方法的研究与对比[D].东华大学,软件工程(专业学位),2014,硕士.
[36]黄兆峰.田旋花对草甘膦耐药性分子机制[D].中国农业科学院,杂草科学,2014,博士.
[37]王静.低碳经济与技术创新的互动机制研究[D].山东财经大学,政治经济学,2012,硕士.
[38]李长梅.论中专生写作主体性的培养[D].福建师范大学,教育,2003,硕士.
[39]马霄.厌氧—准好氧型生物反应器填埋场有机污染物控制研究[D].西南交通大学,环境工程,2014,硕士.
[40]杨艳琦.基于聚类的图像分割方法的研究[D].西安电子科技大学,计算数学,2013,硕士.
[41]董文,包敏,李碧云,袁卉华,娄向新,张彦中.含石墨烯的聚乳酸复合纳米纤维的制备及细胞相容性[J].功能高分子学报,2014,02:147-156.
[42]赵伟.尕海—则岔国家级自然保护区游憩活动对植被的影响及旅游开发对策研究[D].甘肃农业大学,森林经理学,2013,硕士.
[43]约翰·安托尔,吴磊.战争、机器人和能源[J].国外坦克,2014,12:7-8.
[44]宋睿卓,肖文栋,孙长银.基于数据ADP算法的一类带有执行器饱和的未知离散时间系统最优跟踪控制(英)[J].自动化学报,2013,09:1413-1420.
[45]胡雅婷.浙江省生产性服务业地区差异的影响因素研究[D].浙江工商大学,产业经济学,2012,硕士.
[46]韩永洁.纳米纤维丝素蛋白与脱细胞基质真皮在口腔黏膜修复重建中的动物实验研究[D].苏州大学,颌面整形,2014,硕士.
[47]刘秀萍.欧盟北约双东扩与欧美关系[D].外交学院,国际关系,2004,硕士.
[48]王长江.中小企业ERP系统集成研究[D].中北大学,2005.
[49]任翔.基于J2EE权限管理系统平台设计与实现[D].吉林大学,软件工程,2013,硕士.
[50]王健.粘土旧砂完全再生关键设备技术方案的研究[D].山东建筑大学,材料加工工程,2013,硕士.

相关推荐
更多