基于分子光谱的多元校正模型优化与转移方法及其应用研究

基于分子光谱的多元校正模型优化与转移方法及其应用研究

作者:师大云端图书馆 时间:2015-11-21 分类:毕业论文 喜欢:3639
师大云端图书馆

【摘要】摘要:分子光谱是一种常用的获得物质定性和定量信息的分析手段,主要包括紫外-可见光谱(Ultraviolet-VisibleSpectroscopy)、近红外光谱(NearInfraredSpectroscopy)、中红外光谱(Mid-InfraredSpectroscopy)、拉曼光谱(RamanSpectroscopy)和荧光光谱(FluorescenceSpectroscopy)等。因为分子光谱测试简单便捷、适合于多种形态的样本分析且信息丰富,在化学成分分析中有着非常广泛的应用。尤其是近红外光谱和拉曼光谱与多元校正方法相结合,不需做样本预处理,可实现样本的无损在线分析,广泛应用于各个领域。然而,由于干扰和其它光学效应的存在,此类光谱一般具有背景复杂,谱峰重叠,信号弱等特点。因此,如何从复杂、重叠的分子光谱信号中提取微弱的有用信息,并建立满足需要的校正模型是目前基于分子光谱技术进行定性和定量分析的关键,直接决定该项技术的可用性。基于此,本论文主要以近红外光谱和拉曼光谱为对象,对影响分子光谱建模的奇异样本检测、光谱预处理、波长选择、多元校正模型建立和转移方法、光谱融合等方面进行了研究,主要内容包括:一、奇异样本的消除与否对模型的稳健性和预测精度有着重要影响,分子光谱的建模大量应用了主成分回归和偏最小二乘回归等非稳健的多元校正方法,采用这些方法进行建模之前,应对光谱数据的奇异点进行检测和剔除。由于光谱的高度相似性,我们只能够借助于些数学方法来对这些样品进行评估和诊断。本文采用了基于蒙特卡洛采样的奇异样本诊断方法,对近红外光谱测定液态牛奶的蛋白质和脂肪含量数据及拉曼光谱测定汽油中总烯烃含量的数据进行了诊断,并与经典方法马氏距离法和稳健偏最小二乘法进行了比较,结果表明,采用基于蒙特卡罗采样的方法能够有效的剔除数据中的奇异样品,显著提高模型的预测精度,其结果优于马氏距离法和稳健偏最小二乘法,可以在光谱分析的数据诊断中发挥有效作用。二、分子光谱数据的共线性十分严重,通过筛选特征波长(波数)建模可以简化模型并提高模型的预测能力和稳健性。本文分别通过对不同食醋种类的近红外光谱识别,食醋总酸含量的近红外光谱测定,不同植物油的拉曼光谱识别及白酒中乙醇含量的拉曼光谱测定四个应用对象进行研究,引入竞争自适应重加权采样(CompetitiveAdaptiveReweightedSampling,CARS)方法选择关键波长(波数)建立模型,采用这些关键波长(波数)建立的模型,模型复杂度降低且预测误差有了显著的减小,证明了CARS方法可以和光谱分析相结合,在光谱定性和定量应用中起到较好的作用。三、多元校正模型的建立是进行分子光谱定性定量分析的基础,新型建模方法一直是本领域研究的热点之一。本文针对不同光谱数据的特点,结合机器学习的最近进展,发展了两种新的光谱定性定量分析多元校正方法。第一种方法是结合小波变换和随机森林(RandomForest,RF)的分类方法,用于近红外光谱对蜂蜜掺假的鉴别。小波分解和重建可以压缩光谱数据并过滤掉噪声等干扰信息,而随机森林方法作为一种包含多个决策树的分类器具有优良的分类效果,可以提高光谱定性识别的正确率。第二种方法是小波变换结合支持向量机(SupportVectorMachines,SVM)方法,用于拉曼光谱对汽油中总芳烃含量的测定。同样采用小波分解和重建压缩过滤光谱之后,采用基于结构风险最小化的SVM模型进行预测,与偏最小二乘法(PLS)的结果比较表明,该方法能够提升预测结果。四、为了解决不同光谱仪器之间光谱的差异性问题,提出了一种基于典型相关分析的光谱多元校正模型转移新方法。典型相关分析是一种能够有效地揭示两组变量之间相互线性依赖关系的多元统计分析方法。在本方法中,我们首先对原光谱和目标光谱进行典型相关分析,然后用所得到的典型相关变量进行转换。因为两组光谱之间反应被测物信息的部分是一致的,应该是相互线性相关的,而噪声和干扰信息是随机的,所以是无关的。结果表明,采用典型相关变量进行转换,可以从整体光谱中提取有效信息,同时滤除噪声和干扰信息,得到较好的模型转移结果。五、光谱分析的预测质量主要取决于多元校正模型的质量。因此模型建立之后的验证也十分重要。当前,模型验证一般建立在一个单独的测试集或者固定样本分组后的单次交叉检验上,这样的比较方法在小数量样本上具有得出错误结论的风险。基于此,我们根据模型集群分析的思路,通过不断改变测试集与训练集的样本划分,获取了不同样本集的预测误差的分布,并可以对它们进行统计检验,可以得到可靠的结论。结果表明,这样能够提高模型验证比较的可靠性。六、近红外光谱和拉曼光谱均具有多种不同种类的仪器,包括实验室研究型或者便携式仪器,傅立叶变换型或者CCD检测器型等。这些仪器具有不同的分辨率以及性能。结合合适的化学计量学处理方法,较弱性能的仪器数据有可能达到和较高性能仪器数据相类似的预测效果。本文基于此,对不同分辨率的光谱仪器测试了相同的样本,分别加以处理后,对预测结果进行了统计检验,结果表明,合适的数据处理方法可以大幅提高较弱性能仪器的预测结果,并达到与较高性能的仪器预测结果相类似的水平。七、不同的分子光谱具有不同的特点和优势。本文基于近红外光谱和拉曼光谱的互补特性,提出一种将近红外光谱和拉曼光谱融合建模的新方法,通过将两种预处理之后的光谱以主成分的形式连接起来,融合两种光谱的信息进行建模,结果表明模型的预测精度比单一近红外光谱或拉曼光谱所建立模型的预测精度高,可作为分子光谱分析的一个新思路。
【作者】范伟;
【导师】梁逸曾;
【作者基本信息】中南大学,分析化学,2013,博士
【关键词】分子光谱;近红外光谱;拉曼光谱;奇异样本筛选;波长选择;多元校正;模型转移;光谱融合;

【参考文献】
[1]刘国智.陶瓷材料纳米切削与烧结过程的分子动力学仿真[D].沈阳建筑大学,机械电子工程,2012,硕士.
[2]党朝胜.海峡两岸经贸关系发展演变初探[D].中国社会科学院研究生院,世界经济学,2003,硕士.
[3]任莉.基于图形分类识别的辅助设计系统[D].重庆大学,光学工程,2003,硕士.
[4]刘波.线在室内设计中的特性及运用[D].青岛大学,设计艺术学,2013,硕士.
[5]王宝太.565Mbit/s光中继器插分方式[J].光通信研究.1992(04)
[6]罗晓雷.宫内发育受限大鼠海马组织中GHSR的表达变化及其与学习记忆、情感行为的关系[D].河北医科大学,儿科学,2013,硕士.
[7]柯人观.微电网典型供电模式及微电源优化配置研究[D].浙江大学,2013.
[8]林奕专.知识型员工自助式薪酬构成要素偏好研究[D].浙江大学,管理科学与工程,2003,硕士.
[9]廉军.天津发展独立学院的政策研究[D].天津大学,公共管理,2004,硕士.
[10]于俊钊.孪生支持向量机及其优化方法研究[D].中国矿业大学,计算机软件与理论,2014,硕士.
[11]表永一.边沁功利主义伦理思想探微[D].西南大学,伦理学,2014,硕士.
[12]张华桥.光子逃逸因子对吸收光谱影响的研究[D].河南科技大学,凝聚态物理,2012,硕士.
[13]刘玉珍.人高级别宫颈上皮内瘤变细胞的原代培养及其生物学特性的体外研究[D].山东大学,临床医学(专业学位),2014,博士.
[14]李雨锡.我国污染场地再利用污染防治法律问题研究[D].兰州大学,环境资源与保护法学,2013,硕士.
[15]胡刚.橡胶/粘土纳米复合材料的新型制备方法及结构与性能的研究[D].中北大学,高分子化学与物理,2013,硕士.
[16]李孝昀.“互相”与“相互”的辨析及偏误分析[D].华中师范大学,汉语国际教育,2014,硕士.
[17]曲晓飞,马洪杰,高天一,刘波.面向企业动态联盟实现的技术解决方案设计研究[J].组合机床与自动化加工技术,2001,05:6-8.
[18]向小芳.信息时代大学图书馆检索空间设计研究[D].中国矿业大学,建筑学,2014,硕士.
[19]王庆芳.社区自助健康管理系统的设计与实现[D].青岛大学,计算机软件与理论,2013,硕士.
[20]周丽萍.基于大学生思想品德培养的校园文化建设研究[D].湖北工业大学,思想政治教育,2013,硕士.
[21]刘丹.基于供应链管理的FXK保健酒营销渠道优化研究[D].西安科技大学,项目管理,2014,硕士.
[22]王鑫.抗菌肽attacin在家蝇胚胎细胞的表达及生物学活性研究[D].遵义医学院,免疫学,2014,硕士.
[23]刘瑜.投影法检测光学元件面形的算法优化[D].西安工业大学,光学工程,2014,硕士.
[24]尹华军,赖挺,程新颖,蒋先敏,刘庆.增温对川西亚高山针叶林内不同光环境下红桦和岷江冷杉幼苗生长和生理的影响[J].植物生态学报,2008,05:1072-1083.
[25]钟国敏.河南省典型市域土地利用变化及与土壤多样性的关联分析[D].郑州大学,土地资源管理,2013,硕士.
[26]邹岿.反信用证欺诈的对策研究[D].安徽大学,国际贸易学,2004,硕士.
[27]钱富才,伍光宇.一种T-S模型的在线辨识算法[J].控制与决策,2015,02:343-347.
[28]纪波林.水文时间序列基本算法组件及其柔性集成[D].河海大学,计算机应用技术,2004,硕士.
[29]高萌.基于风险管理角度的国际工程项目内部控制研究[D].首都经济贸易大学,会计学,2013,硕士.
[30]刘了.钻井泥浆固化处置对土壤环境的影响分析[D].西南交通大学,环境工程,2013,硕士.
[31]章婧.拒水拒油型聚氨酯树脂的制备及性能评价[D].武汉纺织大学,纺织化学与染整工程,2014,硕士.
[32]程玉.酶解法制备海鲜菇调味料的研究[D].浙江大学,食品科学,2013,硕士.
[33]刘建新.五苓散对高盐诱发羔羊尿结石防治作用的研究[D].内蒙古农业大学,临床兽医学,2013,硕士.
[34]侯俊.功能化离子液体的制备及其电化学性能研究[D].哈尔滨工业大学,化学工程与技术,2014,硕士.
[35]崔晓岷.环球运费网集装箱订舱系统[D].大连理工大学,软件工程(专业学位),2013,硕士.
[36]毛科技,赵小敏,何文秀,夏明,王磊,陈庆章.WSN中基于区域划分的半自动DV-Hop定位算法[J].计算机科学,2012,03:39-42+70.
[37]余然.基于分子逻辑门的食源性致病菌DNA检测技术研究[D].宁夏大学,应用化学,2014,硕士.
[38]平措次仁.绰普译师哲学观之发展历程研究[D].西藏大学,藏语言文学,2014,硕士.
[39]陆超.基于ACE的金融市场建模关键技术研究[D].北京交通大学,2009.
[40]王瑜.医院感染实时监控管理系统的设计与实现[D].山东大学,软件工程(专业学位),2013,硕士.
[41]张霭.黄酮类药物的电化学行为研究及其分析检测[D].山西大学,2010.
[42]郭世杰.高速切削镍基合金热力耦合有限元建模及分析[D].内蒙古工业大学,机械工程,2013,硕士.
[43]陈宁杰.TGF-β_1和NOS_2在骨性关节炎滑膜组织中的表达及相关性研究[D].青岛大学,外科学,2003,硕士.
[44]陶雯.农户青虾新品种采纳行为及其影响因素分析[D].南京农业大学,技术经济及管理,2012,硕士.
[45]叶胥.区域发展格局调整下的西向拓展战略研究[D].四川省社会科学院,区域经济,2013,硕士.
[46]尹慧芳.黄球生孢噬纤维粘菌酶系表征及其降解产物分析[D].山东大学,微生物学,2013,硕士.
[47]王婧.我国农民工城镇住房保障问题研究[D].山西财经大学,社会保障,2014,硕士.
[48]周珂.“三自课堂”在高中数学教学中的初步实践与思考[D].华中师范大学,学科教学,2014,硕士.
[49]纪宁宁.高中数学化归思想及其实践研究[D].河北师范大学,学科教学,2014,硕士.
[50]刘鹏.KR机械脱硫搅拌器内流体流动特性研究[D].东北大学,工程热物理,2010,硕士.

相关推荐
更多