基于有限状态自动机的蒙古文同形词校对方法的研究

基于有限状态自动机的蒙古文同形词校对方法的研究

作者:师大云端图书馆 时间:2017-09-13 分类:参考文献 喜欢:2987
师大云端图书馆

【摘要】随着蒙古文信息处理技术的发展,研究内容越来越深入,如何保证文本的正确性,显得越来越重要。因此,校对的工作量也随之增大,对于飞速增长的电子文本,人工校对的方法已经无法满足,蒙古文文本自动校对已成为一个亟待解决的问题。蒙古文是一种拼音文字,区别于其它拼音文字的是,在书写时,蒙古文使用变形显现字符来表示文字。输入者常常把那些形状相同读音不同的变形显现字符错误地录入到单词中,这种现象被称为形同音异现象。从字形上看,该单词是正确的,可是它内部的编码是错误的。在多数情况下,计算机是按照字符编码识别词汇的,如果不纠正这些错误,将使蒙古文信息处理的研究变得更加困难。检查非词错误的传统有效方法是查找词典,如果指定单词不在词典中,则认为非词。然而,蒙古语是粘着性语言,拼音文字,多数构词都是由词根或词干连接不同的后缀来实现的。词典中包含的单词数量有限,为扩大词汇的覆盖面,可使用词典结合于构词规则的方法,这也是处理粘着性语言时常用的方法。本文将词典和构词规则融合到有限状态自动机模型中,介绍了一种基于有限状态自动机的蒙古文同形词校对方法。首先,以《蒙古文正字法词典》为依据,根据蒙古语单词的语法特征以及词的结构,构造词法分析器。然后蒙古文国际标准编码基本字符集、传统蒙古文名义字符的变形显现字符以及变形规则,建立同形字符规则库。最后,根据同形字符规则库,在词法分析器上进行启发式搜索,如果输入单词正确,则不做任何处理;如果输入单词错误,则用与其同形的单词对其纠错。
【作者】廉冰;
【导师】巩政;
【作者基本信息】内蒙古大学,计算机科学与技术,2014,硕士
【关键词】蒙古文;同形词;有限状态自动机;拼写校对;

【参考文献】
[1]何春.基于特征的交通标志图像识别的应用研究[D].广东工业大学,车辆工程,2013,硕士.
[2]汪国林.牵引供电系统跳闸原因分析[J].上海铁道科技.2007(01)
[3]魏文波.我国未成年人轻罪记录消除制度研究[D].贵州民族大学,刑法学,2012,硕士.
[4]原庆.X波段振荡器设计[D].电子科技大学,通信与信息系统,2012,硕士.
[5]马一澜.我国亲告罪合理范围研究[D].苏州大学,刑法学,2013,硕士.
[6]方洪全,曾勇.银行电子业务运行的风险分析及控制对策研究[J].系统工程,2004,03:62-65.
[7]钱伟飞.基于J2EE的高校信息化平台的设计与实现[D].电子科技大学,软件工程(专业学位),2012,硕士.
[8]邓祥静.万科集团企业价值评估[D].青岛理工大学,资产评估,2013,硕士.
[9]吴利娟.基于全球价值链视角的山西省加工贸易转型升级研究[D].山西财经大学,国际贸易学,2014,硕士.
[10]张峥.加密域中图像的参数自适应有损压缩方法研究[D].哈尔滨工业大学,计算机科学与技术,2014,硕士.
[11]罗伟.工读学校学生与普通学校学生归因方式特点和心理健康水平的比较研究[D].首都师范大学,心理健康教育,2013,硕士.
[12]段茜.公民社会视角下美国社区的公民参与[D].外交学院,国际政治,2014,硕士.
[13]刘毅.国际劳务合作对中国经济发展的影响研究[D].安徽大学,国际贸易学,2014,硕士.
[14]张旋.当代鲁南作家群小说主题研究[D].渤海大学,中国现当代文学,2013,硕士.
[15]温连晨.RFID技术在智能生产管理系统中的应用[D].大连海事大学,电子科学与技术,2013,硕士.
[16]陈远华,刘文华,宋强.基于FPGA的级联逆变器直接PWM发生器[J].电力系统自动化,2006,09:61-63+75.
[17]李宏坤.乙酰胆碱酯酶纳米生物传感器法检测蔬菜中有机磷农药的研究[D].吉林大学,食品科学,2013,硕士.
[18]朱晓梅.多元智能化主题探究活动中幼儿学习评价的研究[D].华中师范大学,教育管理,2012,硕士.
[19]陈媛丽.小青龙汤加味治疗寒饮伏肺型咳嗽变异性哮喘的疗效观察[D].广州中医药大学,中医内科学(专业学位),2013,硕士.
[20]肖欢欢.图的2-距离着色问题的研究[D].重庆大学,应用数学,2014,硕士.
[21]朱玲.土地整理潜力及其生态环境影响分析[D].西南大学,自然地理学,2013,硕士.
[22]尚云鹏.社会主义核心价值观的认同机理研究[D].西安科技大学,马克思主义理论,2014,硕士.
[23]田丙强.松江公立医院功能绩效评价研究[D].上海工程技术大学,社会保障,2010,硕士.
[24]杨景乔.试述涉外产品责任的法律适用[D].西北大学,国际法学,2013,硕士.
[25]温灏洁.我国同业拆借审慎监管制度研究[D].中国政法大学,经济法学,2013,硕士.
[26]廖庆喜,田波平,舒彩霞,郑存虎,张国忠,廖宜涛.4ZG-2.1芦竹收获机的研制[J].农业机械学报.2007(06)
[27]李园薇.城市“社区非正式组织”建构路径及功能研究[D].南京大学,社会工作(专业学位),2013,硕士.
[28]谭在龙.调车监控系统站场数据处理CAD软件的设计[D].西南交通大学,交通信息工程及控制,2014,硕士.
[29]王茂鹏.HIV-1假病毒感染未成熟DC的差异蛋白质组学研究[D].吉林大学,预防兽医学,2014,硕士.
[30]步志昊.我国贫困县政府公共服务能力研究[D].首都师范大学,政治学理论,2014,硕士.
[31]黄慧,刘阳,康振辉.金属/石墨烯纳米复合结构的可控合成及其催化特性研究[A].中国化学会.中国化学会第十四届胶体与界面化学会议论文摘要集-第1分会:表面界面与纳米结构材料[C].中国化学会:,2013:2.
[32]黄文彦,胡乃联,王佐成.数据仓库技术在黄金矿山成本分析中的应用[J].黄金,2005,05:1-5.
[33]袁青.集体行动的破解之道[D].华中师范大学,地方政府学,2014,硕士.
[34]何庞.七号信令监测系统中负荷分担链路上信令事件合成技术的研究[D].重庆大学,电子与信息工程,2003,硕士.
[35]陈纲.冷轧辊质量统计与分析系统—质量分析子系统的设计与实现[D].东北大学,系统工程,2010,硕士.
[36]陈晓倩.杨木预水解液中低聚糖的分离和提纯[D].齐鲁工业大学,制浆造纸工程,2014,硕士.
[37]李梅.H102对APP转基因鼠学习记忆的影响及其作用机制[D].天津医科大学,生理学,2009,硕士.
[38]王刚.基于荧光ARMS技术检测EGFR信号通路关键基因热点突变的方法[D].西北大学,生物化学与分子生物学,2014,硕士.
[39]林少萍,郁建林.地理信息系统在自来水管网信息管理中的应用[J].城市公用事业.1996(01)
[40]陈仁贵.JDB系列全自动继电保护器[J].新疆石油科技.1991(01)
[41]张秀敏,彭杰,刘林峰,郑喜科.小松式压力机电气配套件国产化设计与应用[J].一重技术.1994(02)
[42]丁志伟.中原经济区“三化”协调发展的状态评价与优化组织[D].河南大学,人文地理学,2014,博士.
[43]陈玄真.基于双目立体视觉的三维重建方法研究[D].吉林大学,模式识别与智能系统,2014,硕士.
[44]卢亚楠,谢凤英,周世新,姜志国,孟如松.皮肤镜图像散焦模糊与光照不均混叠时的无参考质量评价[J].自动化学报,2014,03:480-488.
[45]申丽君.高效的医药信息服务及云平台应用方法研究[D].江南大学,计算机应用技术,2013,硕士.
[46]但扬清,刘文颖,朱艳伟,李扬,程林.基于补偿法的快速短路电流算法[J].电力系统自动化,2011,14:103-106.
[47]欧真真.小型农田水利设施的供给机制研究[D].南京农业大学,技术经济及管理,2012,硕士.
[48]沈婧.拉曼光谱新技术在纳米材料中的应用[A].中国化学会.中国化学会第28届学术年会第4分会场摘要集[C].中国化学会:,2012:1.
[49]刘春静.模因论视角下的汉语流行语研究[D].西南大学,英语语言文学,2013,硕士.
[50]桓耀辉.QY50P汽车起重机吊臂系统研究[D].长安大学,机械工程,2013,硕士.

相关推荐
更多