基于FRFT相位谱的说话人识别研究

基于FRFT相位谱的说话人识别研究

作者:师大云端图书馆 时间:2020-12-27 分类:参考文献 喜欢:2398
师大云端图书馆

【摘要】由于相位卷绕导致相对复杂的分析和特征参数化以及相位谱无法直接揭示系统谐振特性等问题,相位信息在说话人识别中往往被忽略,但近年来研究表明相位信息对感知具有不可忽视的作用。分数阶傅里叶变换(FractionalFourierTransform,FRFT)是传统傅里叶变换(FourierTransform,FT)的一种推广。短时FRFT的时频聚集性高于短时傅里叶变换(ShortTimeFourierTransform,STFT)。虽然基于FRFT的语音信号处理研究已经取得一定成果,但因为语音所承载信息的复杂性,基于FRFT相位谱的特征提取方法仍存在一些问题。基于相位谱特征提取和基于幅度谱特征提取具有共同点,即在很大程度上都取决于前端处理参数的选择。本论文以Mel频率Delta相位(Mel-FrequencyDelta-Phase,MFDP)特征为例,依据最大互信息准则确定预处理的窗长和帧移最优参数。标准语料库测试实验表明本论文方法的有效性。语音活动检测广泛应用于说话人识别前端处理,本论文提出以E指数调整群时延函数为特征、基于统计模型的语音活动检测方法,测试实验表明该方法的具有较高准确性。针对FRFT最优阶数难以有效确定问题,根据FRFT的性质,以语音AM-FM(AmplitudeModulation-FrequencyModulation)模型为基础,本论文提出采用相位计算最优阶方法,大大降低了计算代价。相比于其他方法,本论文的方法既不需要先验知识,也不需要复杂的搜索过程。真实语音数据的谱图显示,分辨率得到了一定的改善。以此为基础提取的倒谱特征,经标准语料库的说话人识别实验结果表明其识别率比梅尔频率倒谱系数(MelFrequencyCepstralCoefficient,MFCC)特征有所提高。另外,本论文将群时延函数推广到分数阶域,得到广义群时延函数,并指出其较群时延函数具有更少的谐波信息,更易于提取共振峰,且保持一定的噪声鲁棒性。改进广义群时延函数特征经说话人识别测试表明其优越性。本论文主要创新工作如下:1)提出针对相位谱特征的前端预处理参数确定方法。以Mel频率Delta相位谱特征为例,依据最大互信息准则确定预处理的窗长和帧移最优参数。2)提出以E指数调整群时延函数为特征,基于统计模型的语音活动检测方法。针对当零点靠近单位圆时群时延出现尖峰的问题,将群时延进行E指数调整,可以大大降低这种尖峰效应,且保留必要语音信息。3)提出利用相位信息确定FRFT最优阶的方法。不仅降低时间开销,且满足时频聚集性需要。此方法无需先验知识和搜索过程,说话人识别测试实验验证了方法的有效性。4)提出广义群时延函数和改进广义群时延函数,并将广义群时延函数特征用于说话人识别。将FT域群时延函数推广到FRFT域,更易于提取共振峰信息,提高了特征的表征效力,测试实验表明特征的有效性。
【作者】虢明;
【导师】王金芳;
【作者基本信息】吉林大学,信号与信息处理,2014,硕士
【关键词】说话人识别;相位谱;分数阶傅里叶变换;最优分数阶;广义群时延函数;

【参考文献】
[1]郝程程.城市已婚男女性别角色和婚姻质量的关系研究[D].湖南师范大学,心理健康教育(专业学位),2013,硕士.
[2]刘旭华.第三方物流公司的物流配送系统分析与优化[D].湖南大学,软件工程,2013,硕士.
[3]张保彦.聚苯乙烯磺酸型离子交换树脂的工艺合成[D].北京化工大学,化学工程与技术,2013,硕士.
[4]周磊.复杂建筑形体自由曲面量化处理方法[D].湖南大学,软件工程,2012,硕士.
[5]王吉敏.剩余污泥中木质纤维素厌氧产甲烷实验研究[D].北京建筑大学,市政工程,2013,硕士.
[6]李会.扶正化瘀复方调控IκB激酶-β对非酒精性脂肪性肝纤维化作用的研究[D].河北医科大学,内科学,2013,硕士.
[7]杨雪蓉.中学英语课堂学习中母语正迁移现象研究[D].吉林大学,外国语言学及应用语言学,2014,硕士.
[8]慕伟.电梯远程监控系统研究[D].长安大学,机械工程(专业学位),2013,硕士.
[9]吉罗喆.代建类政府投资项目投资控制探究[D].浙江工业大学,2013.
[10]栾云.小檗碱对2型糖尿病大鼠胰腺组织自噬相关蛋白的影响[D].华中科技大学,中西医结合临床,2013,硕士.
[11]吴金保.用地震层速度预测储层砂岩体孔隙度分布的方法[J].石油地球物理勘探,1986,06:632-637+669.
[12]张涛.TD-SCDMA中智能天线的通道误差分析及校准算法研究[D].西南交通大学,计算机技术,2014,硕士.
[13]廖先琴.重庆渝北职业教育中心固定资产管理系统的设计与实现[D].重庆大学,软件工程(专业学位),2014,硕士.
[14]韩占科.中小民营企业员工激励机制研究[D].华中师范大学,工商管理(专业学位),2014,硕士.
[15]刘东岩.不同成长性公司负债融资对投资行为影响的实证研究[D].江苏科技大学,会计学,2013,硕士.
[16]李天琪.论贿赂的外延—“交易对价说”概念之提倡[D].重庆大学,法律(专业学位),2014,硕士.
[17]冯龙龙.环保型汽车齿轮润滑油润滑性能及机理研究[D].沈阳理工大学,机械设计及理论,2013,硕士.
[18]段勇.YS公司可持续发展战略研究[D].西安科技大学,工商管理,2014,硕士.
[19]胡思熠.长焦深数字灰度光刻物镜设计[D].湖北工业大学,测试计量技术及仪器,2013,硕士.
[20]魏丽英,王志龙,吴荣华.交叉口进口道换道行为研究及建模[J].物理学报,2014,04:196-200.
[21]房建成,申功勋,万德钧.车载GPS/DR/地图匹配组合导航系统的自适应联合卡尔曼滤波模型[J].控制与决策,1999,05:448-452.
[22]罗宁,穆志纯.CRM在电信行业中的应用与技术[J].计算机时代,2004,01:45-46.
[23]吴止境.基于FPGA的ECT/ERT双模态层析成像系统设计[D].东北大学,检测技术与自动化装置,2010,硕士.
[24]丁超员.字符识别技术在机车元件检测中的应用研究[D].苏州大学,计算机技术(专业学位),2013,硕士.
[25]王晶.中美两所知名护理学院信息分析与信息综合研究[D].第四军医大学,图书馆学,2014,硕士.
[26]单巧芬.论信用证下议付行的法律地位[D].宁波大学,经济法(专业学位),2014,硕士.
[27]曾宪奇.沈阳市宏达驾校教练员教学综合素质提升研究[D].吉林大学,项目管理,2014,硕士.
[28]金铎.电磁旋流水口作用下水口和结晶器内流场和温度场的实验研究[D].东北大学,钢铁冶金,2010,硕士.
[29]邓子怡.基于J2EE的信贷管理系统的设计与实现[D].天津大学,软件工程,2013,硕士.
[30]庄悦.基于可持续增长理论的公司财务战略研究[D].黑龙江八一农垦大学,会计学,2013,硕士.
[31]黄芳.复杂地层中大位移井井壁稳定性数值分析[D].河北工业大学,工程力学,2013,硕士.
[32]王丽敏.英汉委婉语对比研究[D].上海师范大学,英语语言文学,2004,硕士.
[33]高炳杰.小学数学学困生的调查研究[D].鲁东大学,数学与统计科学(专业学位),2013,硕士.
[34]郭蕊.基于B/S结构的新闻发布系统[D].吉林大学,软件工程,2014,硕士.
[35]罗黎军.中国对外直接投资的母国决定因素[D].复旦大学,世界经济,2012,硕士.
[36]宋玮.参数化设计在立体影视制作中的应用[D].北京工业大学,软件工程(专业学位),2013,硕士.
[37]吴炳生.福建某铜矿床三维地质建模及资源量估算[D].中国地质大学(北京),地质工程,2014,硕士.
[38]周刚.我国刑法空间适用范围的立法研究[D].西南政法大学,刑法学,2012,硕士.
[39]陈慧琳.日本学生汉语语音偏误分析及教学对策[D].山东师范大学,对外汉语教学,2013,硕士.
[40]吴志鸿,廖森,姜求宇,宋宝玲,王建设,周明山.新法合成碱式碳酸铝铵及纳米氧化铝[J].轻金属,2004,09:12-16.
[41]邹群,黄铮,邹国平.高速公路运营管理综合决策支持系统框架研究[J].交通标准化,2005,09:120-123.
[42]赵欣.“九七”后香港电影中内地人形象的转变[D].东北师范大学,文艺学,2012,硕士.
[43]黄奇萃.记者权利及其救济[D].复旦大学,新闻学,2012,硕士.
[44]胡玥.切花菊盆栽的株型调控技术研究[D].南京农业大学,园艺,2013,硕士.
[45]周霞.论中国合唱艺术中的民族语言特质[D].西南师范大学,音乐学,2004,硕士.
[46]邵红敏.瓣状光纤及其掺镱激光器特性分析[D].中国科学院研究生院(西安光学精密机械研究所),光学,2013,硕士.
[47]杨子玉.BIM技术在设施管理中的应用研究[D].重庆大学,建筑与土木工程(专业学位),2014,硕士.
[48]贺欣.太子河本溪段环境综合整治方案研究[D].东北师范大学,环境科学,2012,硕士.
[49]计冰燕.中国对外贸易安全及可替代市场谱系研究[D].浙江工业大学,产业经济学,2012,硕士.
[50]夏敬英.住宅小区的交通组织及其人性化设计[D].湖南大学,建筑学,2011,硕士.

相关推荐
更多