基于计算听觉场景分析的单信道语言分离

基于计算听觉场景分析的单信道语言分离

作者:师大云端图书馆 时间:2015-09-02 分类:毕业论文 喜欢:2380
师大云端图书馆

【摘要】摘要:单信道语音分离(Single-channelspeechseparation,SCSS)指在无法预知声源先验信息的情况下,仅根据观测到的单路混合信号恢复原声源的过程。计算听觉场景分析(Computationalauditorysceneanalysis,CASA)是解决该问题的一种新方法。它通过寻找语音中感知相关的区分性特征实现语音分离,并避免了对噪声特性的过多假设。当前,CASA的研究主要集中于两个方向:1)数据驱动型CASA;2)基于模型的CASA。前者主要对应于生物快速的、本能的条件反射;而后者主要针对相对缓慢的、高层的推理过程。在应对复杂声场景时,生物所具备的迅速反应能力预示着声源分离的工作很大程度是在底层完成的。有鉴于此,本文对数据驱动型CASA进行了较为深入的研究,其中主要的工作和贡献如下:1.针对短时幅度调制谱(Amplitudemodulationspectrum,AMS)分辨率低的特点,提出了一种重分配(reassignment)策略的双话者(Co-channel)语音分离算法。该算法通过可变截止频率的低通滤波器抽取出依子带变化的幅度调制信号(AmplitudeModulation,AM);接着,将抽取出的AM信号谱(spectrum)上的每一能量点重新放置,有效实现了信号成分的会聚,并缓解了时间分辨率和频率分辨率的矛盾。实验结果表明,基于重分配AMS的语音分离方法具有明显改善的性能。2.受Schroeder直方图、Goldstein听觉感知理论以及Meddis’‘相关图”(Correlo-gram)的启发,提出了一种基于“高斯图”(Gaussgram)的多基音(multi-pitch)检测算法。“高斯图”通过采用可变带宽的高斯函数修正“相关图”得到,具有抑制次谐波(sub-harmonics)的特点。将其用于检测基音,单帧基音检测的半频错误明显减少。另一方面,该方法采用检测得到的主基音轨迹消除其次谐波轨迹,进一步抑制了半频错误。系统评估表明,提出的多基音检测算法具有更少的倍/半频错误。3.提出了一种多层感知器的量化门限自适应新方法,从而给出一种改进的多层感知器(Multi-layerperceptron,MLP)。将该MLP嵌入CASA计算框架,可以提高系统在训练和测试信噪比(Signal-to-noiseratio,SNR)不匹配条件下的鲁棒性,减少性能的下滑。对比实验表明,该方法可以改善分离系统在不同SNR下的性能。
【作者】胡琦;
【导师】梁满贵;
【作者基本信息】北京交通大学,信号与信息处理,2014,博士
【关键词】盲源分离;单信道语音分离;计算听觉场景分析;二进制掩蔽;特征;提取;

【参考文献】
[1]李志康.磺胺间甲氧嘧啶对鸡肉营养品质的影响[D].河南科技大学,食品科学,2013,硕士.
[2]高敏.企业社会责任信息披露对股票流动性影响的研究[D].天津商业大学,会计学,2013,硕士.
[3]魏丽雅.投资者关注度对股票流动性和市场表现的影响[D].南京大学,企业管理(专业学位),2013,硕士.
[4]朱建宁.甘肃省报春花科植物系统分类与区系地理[D].甘肃农业大学,植物学,2013,硕士.
[5]孙中海.中国核安全监管体制研究[D].山东大学,法律(专业学位),2013,硕士.
[6]胡自玉.表面氧化和轻元素共价材料储氢的第一性原理研究[D].北京化工大学,化学工程与技术,2012,博士.
[7]石靖.1,3-二(4,4,4-三氟甲基-1,3-氧代异丁基)苯金属配合物的荧光及催化性质研究[D].黑龙江大学,有机化学,2013,硕士.
[8]张帅.海洋观测网络化智能接口模块设计研究[D].国家海洋技术中心,港口、海岸及近海工程,2013,硕士.
[9]陈玉波.甘蓝型油菜A1上主效含油量QTL OilAl与千粒重QTL SWA1的精细定位[D].杭州师范大学,植物学,2013,硕士.
[10]王灵灵.叶兆言小说研究[D].兰州大学,中国现当代文学,2013,硕士.
[11]张淼.社会化媒体在市场营销中的应用研究[D].首都经济贸易大学,工商管理(专业学位),2014,硕士.
[12]宋尔行.再论购买力平价[D].浙江工商大学,统计学,2013,硕士.
[13]张昕.恩施州经济发展路径实证分析[D].湖北民族学院,民族学,2013,硕士.
[14]张宏杰.甘肃省民族地区农村社会事业发展的现状及改进策略研究[D].兰州大学,公共管理(专业学位),2013,硕士.
[15]徐聪.CYP2B6体外诱导活性评价模型的建立和应用[D].浙江大学,药学,2013,硕士.
[16]耿龙.从LCP废弃物中回收高纯度4,4’-联苯二酚及4,4’-联苯二酚的合成研究[D].华东理工大学,化学工程,2013,硕士.
[17]陈畅.非O血型人群通过升高血脂水平增加冠心病发病风险[D].南方医科大学,临床医学(专业学位),2014,博士.
[18]裴敦和.泰山古树名木雪压危害的调查报告[J].中国园林.1990(01)
[19]黄克安.双星快速定位系统及提高定位精度的途径[J].电讯技术.1991(02)
[20]鲍静海,徐明,李秉华.科技型小微企业信用风险分担机制研究[J].经济问题,2014,10:25-30.
[21]朱姝.吴绮生平与交游研究[D].鲁东大学,中国古典文献学,2014,硕士.
[22]李淑淑.国内外小学科学课程标准目标和内容的比较研究[D].西南大学,课程与教学论,2013,硕士.
[23]陈程.双链小分子阳离子对活性染料在蚕丝上的促染[D].西南大学,资源纤维学,2014,硕士.
[24]缪大经.进口纸浆的若干启示[J].包装世界.1999(02)
[25]胡广扬,张淑兰.中国煤矿火灾的防治[J].中国安全科学学报.1992(01)
[26]台连玉,肖洪群.B&WSMC型柴油机活塞断环原因及对策[J].航海技术.2005(03)
[27]李江涛.基于行为的病毒检测系统的设计与实现[D].北京交通大学,2008.
[28]王作成.手机支付平台的设计与实现[D].吉林大学,软件工程,2014,硕士.
[29]丁然.未来通信中的语音图像数据格式设计与仿真[D].成都理工大学,电子与通信工程,2013,硕士.
[30]陈超.车载自组织网络数据传输技术研究[D].湖南大学,信息与通信工程,2012,硕士.
[31]刘加明.嫩江流域辽金古城初步研究[D].大连大学,专门史,2014,硕士.
[32]谭方舟,刘江,孙若愚,王璞.基于多模干涉效应的全正色散被动锁模掺镱光纤激光器[J].中国激光,2013,04:60-64.
[33]李敏.农村中小企业融资体系研究[D].山西财经大学,金融学,2014,硕士.
[34]戴玉兰.两种聚集体的非键作用及其对光谱性质影响的理论研究[D].西南大学,物理化学,2013,硕士.
[35]王舒雅.人工免疫算法中多样性的研究[D].南京邮电大学,信息网络,2013,硕士.
[36]钟惠仪.应用项目反应理论对《绝经综合征评定量表》项目修订初步研究[D].广州中医药大学,中医妇科学(专业学位),2013,硕士.
[37]刘擎.Toll样受体拮抗剂中药对缺血性心血管病的作用与机制[D].广州中医药大学,中西医结合临床,2014,博士.
[38]陈洁.试验用脉冲爆震发动机控制系统设计[D].南京理工大学,航空工程,2013,硕士.
[39]盛伟明,王德海,蔡万泼,张周达,寿晓红.熔融制备具有微结构的聚乙烯蜡/分子筛复合粒子[J].涂料工业,2013,01:4-7.
[40]魏敏.10kV智能箱式变电站的设计与研究[D].华侨大学,电气工程(专业学位),2013,硕士.
[41]彭本红.基于复杂系统方法论的区域生态环境可持续发展研究[D].广西大学,农业经济管理,2003,硕士.
[42]杨雪.自主式智能体的跟踪控制问题研究[D].中国海洋大学,计算机应用技术,2014,博士.
[43]申晓娜.“细胞膜—系统的边界”说课的同课异构探讨[D].河北师范大学,学科教学,2014,硕士.
[44]李凌浩,王其兵,白永飞,周广胜,邢雪荣.锡林河流域羊草草原群落土壤呼吸及其影响因子的研究[J].植物生态学报,2000,06:680-686.
[45]陈幻.淮阳民间造物“泥泥狗”之原始性探析[D].西安美术学院,美术学,2014,硕士.
[46]马越峰,李凡,陈平.基于程序源代码的设计模式自动发现技术研究[J].计算机科学,2005,06:181-184.
[47]汤志强.中航工业南方电动汽车发展战略研究[D].湖南工业大学,工商管理,2012,硕士.
[48]李志荣.东胜区小学语文教师教学能力的研究[D].内蒙古师范大学,教育(专业学位),2013,硕士.
[49]程勤.厦门市厦港旧城社区公共空间研究[D].华侨大学,建筑学,2014,硕士.
[50]曲鹏.基于ZigBee游梁式抽油机工况监测与故障诊断系统研究[D].东北石油大学,电力电子与电力传动,2013,硕士.

相关推荐
更多