基于层次短语模型的蒙—汉统计机器翻译研究

基于层次短语模型的蒙—汉统计机器翻译研究

作者:师大云端图书馆 时间:2017-10-11 分类:参考文献 喜欢:1482
师大云端图书馆

【摘要】随着我国经济、贸易、文化、教育等各个方面飞速发展,跨地区、跨民族的交流与合作越来越密切。不同民族之间的交流对翻译存在巨大的需求。近些年来,我国内蒙古自治区的经济发展十分迅猛,越来越多的企业与个人来到内蒙古地区进行贸易活动。这使得人们对传统蒙古文到汉文之间的翻译的需求越来越大。然而,人工翻译满足不了快速膨胀的需求,因此必须借助统计机器翻译技术。目前主流的统计机器翻译方法包括:基于短语的机器翻译、基于层次短语的机器翻译、基于句法树的机器翻译等。目前,传统蒙古文-汉文的机器翻译发展得还不是很成熟。因此,本文针对传统蒙古文-汉文翻译中的特点,对基于统计的蒙-汉机器翻译方法进行了研究。首先,为了解决蒙-汉语言结构差异大、在翻译中普遍存在长距离调序等问题,本文对基于层次短语的统计机器翻译模型进行了深入的研究。之后,本文实现了一套基于层次短语的蒙-汉统计机器翻译系统。该系统可以从未经人工标注的平行语料中自动学习加权的同步上下文无关文法(WSCFG),并利用该同步文法以及基于改进的CKY的解码算法进行高效的蒙-汉翻译。除此之外,针对蒙-汉统计机器翻译平行语料中拼写错误较多的问题,本文提出了一种基于统计翻译框架的传统蒙古文自动拼写校对方法。该方法将拼写校对的过程看作是一种翻译的过程,并引入统计翻译模型进行拼写校对。该方法的校准率最高可以达到97%以上。在最终的翻译对比实验中,本文使用这种方法对基于短语和基于层次短语的蒙-汉机器翻译的训练语料进行的拼写校对。该方法有效缓解了数据的稀疏问题,从而对翻译模型的训练提供了很大的帮助。最终的对比实验表明,比起传统的基于短语的翻译模型,基于层次短语的统计机器翻译模型更加适合从传统蒙古文到汉文的翻译任务,测试集在BLEU值上得到1个百分点的提高。同时,在这两种翻译系统上嵌入的本文提出的拼写校对系统,翻译结果均有不同程度的提升。
【作者】苏传捷;
【导师】侯宏旭;
【作者基本信息】内蒙古大学,计算机科学与技术,2014,硕士
【关键词】蒙古文;汉文;拼写校对;统计机器翻译;层次短语;

【参考文献】
[1]周蓓.二十世纪中国家具发展历程研究[D].中南林学院,木材科学与技术,2004,硕士.
[2]吴国强.架空输电线路插接式钢管杆自动设计与绘图[D].华北电力大学(河北),机械设计及理论,2004,硕士.
[3]刘瑞.进气加湿对船用大功率柴油机性能及排放影响的研究[D].中国舰船研究院,轮机工程,2014,硕士.
[4]金梅花,智林杰.基于石墨烯纳米材料的结构调控及其在绿色能源领域的应用[J].科学通报,2013,24:2411-2424.
[5]刘雯.资本账户开放对货币危机的影响[D].厦门大学,世界经济,2014,硕士.
[6]严冲.复合材料梁腹板的剪切屈曲研究[D].哈尔滨工业大学,固体力学,2013,硕士.
[7]肖帆.医药经济发展中的政府监管研究[D].华中师范大学,公共管理,2012,硕士.
[8]杨露.两种稻飞虱的氨基酸合成相关基因的初步研究[D].南京农业大学,农业昆虫与害虫防治,2012,硕士.
[9]马珊.面向Web文本数据仓库的预处理关键技术研究[D].西安电子科技大学,计算机应用技术,2011,硕士.
[10]牛彦翠.人本城市化评价指标体系问题研究[D].河北经贸大学,行政管理,2014,硕士.
[11]韩雪婷.药用植物远志的谱系地理学研究[D].西北大学,植物学,2014,硕士.
[12]海热古丽·阿布里木提.汉维语修辞格对比及其互译研究[D].新疆大学,中国少数民族语言文学,2013,硕士.
[13]于哲.东蒙地区城镇化过程中公益机构视觉传达研究[D].沈阳建筑大学,设计艺术学,2013,硕士.
[14]洪韵华.毛泽东民生主体思想的哲学探析[D].华中科技大学,马克思主义哲学,2012,硕士.
[15]杜雪萍.母语为英语留学生汉语舌面音词语学习情况考察[D].华中师范大学,汉语国际教育,2013,硕士.
[16]毛鹏,张承学,王元媛,白日昶,胡志坚,帅玲玲.线路零序参数带电测量电容分量补偿算法[J].电力系统自动化,2010,17:55-58+82.
[17]陆红霞.单壁碳纳米管的金属—半导体相变[D].南京大学,2013.
[18]孔晓光,王凤翔,邢军强.高速永磁电机的损耗计算与温度场分析[J].电工技术学报,2012,09:166-173.
[19]疏平.中美经营者集中附加限制性条件制度比较研究[D].安徽大学,法律,2014,硕士.
[20]陈聪.中国房车露营旅游发展研究[D].华中师范大学,自然地理学,2013,硕士.
[21]于喜梅.方回的宋诗审美批评探论[D].安徽大学,文艺学,2013,硕士.
[22]刘晓庆.基于数据挖掘的客户关系管理(CRM)研究[D].东北财经大学,2005.
[23]尚鑫.冷凝热预热再生空气的太阳能除湿空调系统的设计研究[D].山东建筑大学,制冷及低温工程,2013,硕士.
[24]相金.氧化钛基复合薄膜的制备及光电转换性质[D].安徽大学,分析化学,2013,硕士.
[25]孟祥英.幼师生学校归属感与职业价值观的相关研究[D].河北师范大学,教育管理,2014,硕士.
[26]周子龙.基于Android智能手机平台的便携式心电监护仪的设计[D].中南民族大学,生物医学工程,2013,硕士.
[27]程代展,洪奕光.平面控制系统的线性对称性[J].自动化学报,1992,06:686-693.
[28]羊箭锋.压电智能结构振动主动控制技术研究[D].华北工学院,测试计量技术及仪器,2004,硕士.
[29]刘志昕.当代华语电影中的美国形象[D].山西师范大学,戏剧戏曲学,2014,硕士.
[30]袁园.卡布奇诺咖啡专用起泡奶的研究[D].哈尔滨工业大学,食品科学与工程,2013,硕士.
[31]刘钥.连续刚构桥梁的气动性能数值模拟研究[D].湖南大学,2009.
[32]焦尚彬,刘丁,郑岗,张青.基于模糊逻辑方法的高压绝缘子污秽程度评定[J].电力系统自动化,2005,07:84-87+107.
[33]黄日星.《文赋》的文艺心理学思想探析[D].中南民族大学,文艺学,2013,硕士.
[34]王旭东.一种基于改进遗传算法的柔性流水车间调度问题研究[D].广东工业大学,通信与信息系统,2014,硕士.
[35]丁冬梅.宁夏农业可持续发展研究[D].华东师范大学,马克思主义理论与思想政治教育,2003,硕士.
[36]金惠红,薛希鹏,雷文瑜.产学研协同创新的运行机制探讨[J].科技管理研究,2015,05:21-25.
[37]周鑫.半监督算法在自然语言处理中应用的研究[D].哈尔滨工业大学,计算机科学与技术,2014,硕士.
[38]黄璜.终极所有权结构、投资者法律保护与权益资本成本[D].西南交通大学,会计学,2014,硕士.
[39]蒋洁琳.纳米EGCG制备及其对MCF-7肿瘤细胞的抑制功效评价[D].西南大学,茶学,2013,硕士.
[40]刘嘉.俄语政治口号的语言符号学阐释[D].哈尔滨工业大学,外国语言学及应用语言学,2014,硕士.
[41]隋永强.中低温磷化处理工艺和絮凝剂的研究[D].大连理工大学,化学工程,2004,硕士.
[42]王金梅.流动性失衡治理问题研究[D].辽宁大学,投资经济学,2012,硕士.
[43]魏杨.鸡HMGCR基因多态性及其与经济性状相关性研究[D].河南农业大学,动物营养与饲料科学,2012,硕士.
[44]张锐.国际融资租赁资金退出机制研究[D].中国海洋大学,国际商务(专业学位),2014,硕士.
[45]王伟,张庆山,王国才.软土基坑复合土钉支护变形特性的数值模拟研究[J].四川建筑科学研究,2013,06:127-130.
[46]吴楠.铝铜层状复合板搅拌摩擦焊接研究[D].西安建筑科技大学,材料加工工程,2013,硕士.
[47]李勇.电离层闪烁的建模研究[D].北京交通大学,2014.
[48]俞磊,陆阳,朱晓玲,冯琳.物联网技术在医疗领域的研究进展[J].计算机应用研究,2012,01:1-7.
[49]蔡友梅.DQ150J型地下履带式潜孔钻机[J].长沙矿山研究院季刊.1983(04)
[50]王磊.精子DNA损伤与体外受精—胚胎移植相关性研究[D].山东大学,妇产科(专业学位),2012,硕士.

相关推荐
更多