无标注的中文长篇幅语音文语对齐的研究

无标注的中文长篇幅语音文语对齐的研究

作者:师大云端图书馆 时间:2015-09-28 分类:硕士论文 喜欢:1799
师大云端图书馆

【摘要】文语对齐(Text-SpeechAlignment)是以语音识别系统为基础,对语音和文本在时间上进行强制对齐的过程。近年来,随着互联网的高速发展,网络上的语音和文本资源也越来越多,将该部分语音和文本在时间上进行对齐是利用该资源的关键,因此文语对齐问题引起了越来越多研究人员的兴趣。文语对齐技术是语音识别领域中的一项关键技术。传统的方法是首先利用语音识别器对原始的语音进行识别,以得到包含时间信息的识别文本,并将该文本与原始文本进行对齐,以得到两者共同的部分。也就是将文本和语音对齐的问题转换成文本与文本的对齐问题。经过对齐后的语音和文本数据可用于声学模型的训练、语音的评价、自动构建语料库、多媒体检索等领域。为了提高文语对齐的准确率和鲁棒性,通常需要以经过大量有标注数据训练的语音识别器为基础。然而,为了得到有标注的训练数据往往需要耗费大量的财力、人力和物力,同时所需要的周期也相对较长,成本较高。本文在论述国内外文语对齐技术发展的基础上,提出了一种不依赖于有标注数据训练的语音识别器的文语对齐算法。利用该算法可以自动的得到语音和文本在时间上对齐的数据,并利用得到的数据训练了一个基于三音素的连续语音识别器,以说明该算法在实际中的应用。本文的主要的研究工作如下:首先,为了摆脱对有标注训练数据的依赖,提出了一种基于开放语音识别引擎(GoogleVoiceRecognition,GVR)和有限状态机语言模型的文语对齐算法,利用该算法能够自动的得到在时间上对齐的语音和文本数据,具体来说,首先是将原始的语音提交给GVR进行识别,以得到识别的结果文件。但是由GVR返回的结果文件中并不包含时间信息,而该时间信息是进行文语对齐的关键。为了得到该时间信息,接着对原始的语音和文本进行了第二次的识别。即利用由原始的语音和文本训练的识别器作为声学模型,并结合基于有限状态机的语言模型对语音进行了重识别,以得到所需要的时间信息,完成文本和语音的对齐。接下来利用得到的对齐语音和文本数据训练一个声学模型,并以该模型为核心,结合并改进了SailAlign算法来对文本和语音进行高效的、迭代的对齐,完成了语料库的自动构建。实验表明,在文本中的噪音为10%以下时,利用该算法得到的语音和文本对齐的准确率达到95%。最后作为一种评估手段,本文利用上述算法中得到的文本和语音数据训练了一个基于三音素的连续语音的中文识别器,用于评估该算法的性能。并且在对语音信号进行特征提取时加入了基音周期的特征,由于基音周期对请浊音有着良好的区分性,使得该识别器的识别率比传统的只是基于梅尔倒谱参数为特征的识别率有了一定的提高。
【作者】王永远;
【导师】张巍;
【作者基本信息】中国海洋大学,计算机系统结构,2014,硕士
【关键词】文语对齐;有限状态机;语音识别;语言模型;

【参考文献】
[1]李朝.基于热泳取样的乙烯/富氧扩散火焰中碳黑生成及形貌检测[D].华中科技大学,热能工程,2012,硕士.
[2]王丰.食品行业英文自主召回声明体裁研究[D].吉林大学,外国语言学及应用语言学,2013,硕士.
[3]李建华.W公司化妆品研发项目管理[D].广东工业大学,工商管理(专业学位),2012,硕士.
[4]唐芳.三种活性天然产物的合成研究[D].华中科技大学,药物化学,2012,硕士.
[5]鲁淑坤.浅谈工程技术人员的情报素养[J].油田地面工程.1990(04)
[6]倪涛.五河县民营高科技企业研发人员股权激励研究[D].安徽大学,工商管理,2012,硕士.
[7]杨清海.肺腺癌早期浸润过程中基底膜CD34/α-SMA及胞浆β-Tubulin-III的变化[D].福建医科大学,病理学与病理生理学,2013,硕士.
[8]鲁传恒,顾贤明.τ-p偏振滤波地震波场分离[J].石油地球物理勘探,1993,05:543-549+646.
[9]韩敏.大学英语青年女教师职业发展中的教师自我效能感、职业压力与职业倦怠的关系研究[D].西北师范大学,课程与教学论,2013,硕士.
[10]张桂英.现代教育技术的哲学思考[D].内蒙古师范大学,课程与教学论,2012,硕士.
[11]王君芬.我国区域金融的发展差异及空间效应研究[D].浙江工业大学,2009.
[12]任雪娇.基于央行逆回购的商业银行资产负债调整研究[D].山西财经大学,金融学,2014,硕士.
[13]王荣.我国档案与图书工作之关系演变研究[D].黑龙江大学,档案学,2013,硕士.
[14]郝毓业.徐霞客旅游思想初探[D].东北师范大学,旅游管理,2012,硕士.
[15]汪家裕.中、日两国汇率升值影响国内经济增长的比较研究[D].江西财经大学,理论经济学,2013,硕士.
[16]YangNi-hua.The Status Quo of Non-english Learners’ Icc&Cultivating Icc through Culture Teaching[D].西安外国语大学,跨文化交际,2014,硕士.
[17]王文越.子宫内膜癌患者外周血细胞CK20mRNA表达的检测及临床意义[D].吉林大学,临床医学(专业学位),2013,硕士.
[18]李俊丽.在读女硕士生择偶价值取向研究[D].吉林农业大学,社会学,2012,硕士.
[19]张静,田忠和.基于IIS和web日志的关联关系的挖掘[J].华中科技大学学报(自然科学版),2002,08:37-39.
[20]张丙坤.南海北部深水区天然气水合物相关活动构造类型及成因机制[D].中国海洋大学,海洋地质,2014,博士.
[21]闾海鑫.基于供应链的船舶制造企业成本管理研究[D].江苏科技大学,会计学,2013,硕士.
[22]贾敬辉.岩石三点弯曲动态破坏过程数值模拟研究[D].大连理工大学,岩土工程,2013,硕士.
[23]程光辉.ARD算法收敛性分析(英文)[J].自动化学报,2014,05:980-982.
[24]张美多.基于萘酚吡喃的层层自组装薄膜和光响应胶囊的制备及其光致变色性能的研究[D].东北师范大学,高分子化学与物理,2014,博士.
[25]吴永海.立体影像在交互式虚拟展示中的运用探索[D].北京印刷学院,设计艺术学,2013,硕士.
[26]雷蕾.农村初中教师激励机制建设的问题研究[D].西北师范大学,教育经济与管理,2013,硕士.
[27]陈蓉.陈晓勇《水印》(Wasserzaichen)创作技法之研究[D].西安音乐学院,作曲,2013,硕士.
[28]孙小淏.医用硅橡胶表面亲水性改性[D].西安科技大学,材料学,2014,硕士.
[29]黄益,阮殿波,傅冠生.Li_4Ti_5O_(12)锂离子电池的研究和产业化进展[J].电池工业,2014,Z1:327-332.
[30]张希.中链脂肪酸糖单酯的酶法合成以及理化性质和抑菌活性研究[D].浙江大学,食品科学,2014,博士.
[31]闵璐.美国高校教师网络教学能力发展研究[D].西北师范大学,高等教育学,2014,硕士.
[32]倪奇红.组织变革中的组织惯性研究[D].浙江工业大学,企业管理,2012,硕士.
[33]刘立成.伊马替尼(格列卫(?))靶向治疗胃肠道间质瘤的临床疗效分析和蛋白CD133与CAⅡ对患者预后的影响[D].中国人民解放军医学院,普通外科(专业学位),2013,硕士.
[34]魏丽娜.The Application of House’s Model for Translation Quality Assessment on C-e Epc Contract Translation[D].西安外国语大学,翻译,2014,硕士.
[35]李巍.考虑品牌竞争力的家具流通渠道选择研究[D].西南交通大学,物流工程,2013,硕士.
[36]张学杰.信息财产权制度研究[D].东北师范大学,民商法学,2012,硕士.
[37]卜繁志.扩充完善计算机系统的几点做法[J].油田地面工程.1993(05)
[38]蒋仲铭.机车车辆工程文献计算机检索技术的研究开发及推广应用[J].内燃机车.1991(05)
[39]潘月刚.近代日本人旅华游记中的中国观[D].吉林大学,世界史,2013,硕士.
[40]段金平.在建建筑物抵押权问题研究[D].烟台大学,民商法学,2014,硕士.
[41]焦婕妤.论我国生态补偿财政转移支付制度[D].湖南师范大学,经济法学,2014,硕士.
[42]吴飞雪.三维标测下经房间隔与逆动脉射频消融治疗左侧旁路并房室折返性心动过速对比研究[D].广西医科大学,心血管内科(专业学位),2013,硕士.
[43]董萱.基于脆弱水印的图像认证技术研究[D].西安电子科技大学,计算机系统结构,2011,硕士.
[44]张宝琳,唐功友.受扰奇异摄动时滞组合大系统的近似最优控制[J].控制与决策,2007,11:1245-1249+1254.
[45]周宇.特殊岩性岩心实验分析新方法研究[D].中国科学院研究生院(渗流流体力学研究所),2011.
[46]韩耀顺.摩托车座垫底板的有限元分析及优化设计[D].重庆大学,仪器科学与技术,2014,硕士.
[47]陈蓉蓉.概念隐喻在英语习语教学中的应用[D].山东财经大学,外国语言学及应用语言学,2012,硕士.
[48]吴姗姗.转PmHSP25.3基因香石竹植株耐热性研究[D].华中农业大学,园林植物与观赏园艺,2014,硕士.
[49]王文超.论商业特许经营中商号权的法律保护[D].辽宁大学,法律,2012,硕士.
[50]王亮,周建伟,邵澜媛,何明枫,刘东红.计算流体动力学在食品热处理中的应用[J].食品工业科技,2014,03:383-386+391.

相关推荐
更多