图像视频复杂场景中文字检测识别方法研究

图像视频复杂场景中文字检测识别方法研究

作者:师大云端图书馆 时间:2015-11-10 分类:期刊论文 喜欢:3016
师大云端图书馆

【摘要】近年来,随着计算机技术、多媒体技术和网络技术的不断发展,图像和视频资源日益丰富,从这些海量图像、视频中获取感兴趣的信息已经成为当前多媒体信息技术研究的热点。图像、视频中的文字包含丰富的语义信息,是理解图像、视频内容的重要线索,提取和识别这种图像、视频中的文字对于图像理解、视频内容分析、基于内容的图像和视频检索等领域具有重要意义。由于图像、视频中的文字通常叠加在复杂的背景之上,背景的干扰使得现有OCR(OpticalCharacterRecognition)技术难以获得较好的识别结果,因而如何从图像、视频复杂场景中检测识别文字成为一个重要的研究课题。本文以图像、视频复杂场景为研究背景,围绕在复杂场景中文字检测和识别进行研究,根据文字纹理特征,研究了复杂背景中文字的检测、复杂场景中重叠文本的检测和识别、OCR识别结果的校对以及海量视频文本检测识别等问题。概括起来,本文所取得的主要研究成果包括:首先提出了一种基于Gabor和SVM的复杂背景中文字检测方法,通过不同方向尺度的Gabor滤波器得到表示中文字符横、竖、撇、捺四个方向的纹理图像,使用SVM分类器对纹理图像进行训练,通过构建一个SVM分类网络来得到最终的文字区域。实验结果表明,该方法对复杂背景下中文字符的检测具有较好的效果。其次提出了一种利用深度学习算法进行文字区域定位的方法,利用Gabor滤波器提取文字区域的纹理特征,然后使用DBN网络进行分类,由于DBN网络对高维特征向量具有很强的提取特征和分类能力,因此能够用来区分文字区域和背景区域。实验结果表明,深度学习网络具有较高的分类准确性,效果要好于传统的神经网络、SVM等方法。接着针对前面所提出的方法在检测复杂场景中重叠文本时受背景干扰比较大的问题,提出了一种复杂场景中重叠文本检测和识别的方法。首先利用聚类的方法将复杂场景图像转换成多个具有单一背景的层图像,在每一个层图像中使用连通分量分析方法,得到该层图像中的候选文本连通分量,采用级联Adaboost分类器根据文本区域的特征剔除非文本连通分量,再用OCR包对文本连通分量进行识别,最后利用图像层之间的关系对识别结果进行验证。对于复杂场景下重叠文本的识别,该方法明显优于其他方法。然后提出了一种基于Google的文字识别结果校对方法,由于很多字符、文字具有相似性,OCR软件识别过程会产生一些错误,现有的OCR识别结果校对方法主要是利用自然语言规律统计大量的语料库进行语法判断。本文提出了一种基于Google的OCR识别结果校对方法,将传统的基于N-Gram语料库的方法和Google知识库相结合,利用Google知识库来不断的丰富传统的语料库,有效地解决了传统N-Gram方法在字典词汇量有限,对新词、专有名词无法校对的问题。该方法实用性比较强,有效地提高了自然场景图像中OCR的识别率。最后实现了一个基于云计算架构的视频文本检测和识别系统平台,随着大数据时代的到来,现有的文字识别方法遇到了很大的挑战,很难快速的应用到大数据中进行视频文本内容的识别。本文通过连接大量的计算机搭建一个云计算网络,使用MapReduce分布模型实现了视频关键帧的提取,文本检测与识别,识别结果的校对等功能,构建了一个基于云的海量视频文本识别平台,解决了海量视频的文本内容识别问题。另外,本文还分析了当前图像视频复杂场景中文字识别研究中存在的问题,指出了进一步的研究方向。
【作者】颜建强;
【导师】高新波;
【作者基本信息】西安电子科技大学,信息与通信工程,2014,博士
【关键词】复杂场景;文字检测识别;重叠文本;OCR校对;云计算;

【参考文献】
[1]杨泰.La–Mg–Ni系AB_2型贮氢合金相结构及性能的研究[D].内蒙古科技大学,材料学,2013,硕士.
[2]汤胤.基于索网找形的接触网故障诊断技术研究[D].西南交通大学,电气工程,2014,硕士.
[3]孟志娟.基于多元指纹图谱技术的带鱼产地鉴别与新鲜度评价研究[D].浙江海洋学院,农业推广(专业学位),2013,硕士.
[4]丁智.围填海对渤海湾海岸带景观格局演变的遥感研究[D].中国科学院研究生院(东北地理与农业生态研究所),地图学与地理信息系统,2014,硕士.
[5]武燕群.人口老龄化背景下我国养老保险基金平衡研究[D].燕山大学,区域经济学,2014,硕士.
[6]窦耀现.高精度低功耗射频压力记录系统设计[D].华中科技大学,控制工程,2013,硕士.
[7]杨河.高强度钢压型板辊弯成形缺陷分析及控制[D].北方工业大学,机械设计及理论,2014,硕士.
[8]白灵.“分组体验式”体育教学法的实验研究[D].河北师范大学,学科教学,2014,硕士.
[9]林伟斌.喉罩气道与气管插管在新生儿复苏的对照应用研究[D].南方医科大学,儿科学,2012,硕士.
[10]刘林.现代汉语焦点标记词研究[D].复旦大学,现代汉语语言学,2013,博士.
[11]葛成龙.粒细胞集落刺激因子对小鼠内毒素性急性肝损伤的作用研究[D].华中科技大学,内科学,2013,硕士.
[12]吴旭光,房玉.基于状态观测器的H_∞控制系统设计[J].控制与决策,1999,05:433-437.
[13]宋佳.认知心理学视角下的高校图书馆学生用户信息获取行为研究[D].东北师范大学,情报学,2012,硕士.
[14]郝新敏,张建春,杨元.医用多功能防护服研究与发展[J].中国安全科学学报.2005(06)
[15]王颖.掺C_(60)有机聚合物热光特性对不定位干涉作用的研究[D].河北大学,光学,2003,硕士.
[16]王音茵.A公司项目团队建设优化研究[D].大连理工大学,工商管理(专业学位),2012,硕士.
[17]杨默含.一类可重构模块机器人的构型设计及其故障检测研究[D].河北科技大学,检测技术与自动化装置,2013,硕士.
[18]庄金樱.中国学生英语单词拼写中的词汇和亚词汇信息加工[D].宁波大学,外国语言学及应用语言学,2014,硕士.
[19]曲鑫,王小君,和敬涵.基于Kruskal-遗传混合算法的主动配电网规划策略[J].电气应用,2015,08:22-27.
[20]刘万松,杨松林,于晖.深基坑变形监测数据时序分析法的建模与预报[J].北京测绘,2014,01:1-3.
[21]邹春水.混凝土搅拌站配料控制系统的设计与实现[D].南昌大学,电气工程(专业学位),2012,硕士.
[22]汤巧燕.肝肾阴虚型2型糖尿病并发视网膜病变者的表征研究[D].福建中医药大学,中西医结合临床(专业学位),2014,硕士.
[23]滕颖.音乐剧《桂林故事》满妹的唱腔分析[D].广西艺术学院,音乐与舞蹈学,2014,硕士.
[24]张新.基于动态故障诊断的SRLV容错控制方法研究[D].哈尔滨工业大学,飞行器设计,2014,硕士.
[25]陈光涛,崔吉洋,史军峰,朱伟.咸阳市城镇居民体育社团发展对策研究[J].品牌,2015,02:50.
[26]李舒文.多方参与的量子安全通信的一般性协议设计[D].苏州大学,电子与通信工程(专业学位),2014,硕士.
[27]王晓,李彦.单壁碳纳米管与石墨烯相互作用的理论研究[A].中国化学会.中国化学会第29届学术年会摘要集——第30分会:低维碳材料[C].中国化学会:,2014:1.
[28]王雷硕.基于第三方平台的漏洞扫描技术研究与实现[D].北方工业大学,计算机技术,2013,硕士.
[29]魏斌.语用核心观学前言语教育浅论[D].湖南师范大学,教育,2004,硕士.
[30]陈新艳.智能天线对SCDMA无线接入系统性能的影响[D].西北工业大学,电磁场与微波技术,2004,硕士.
[31]金彦辛.商业银行基层行公司信贷风险管理流程研究[D].云南财经大学,工商管理(专业学位),2013,硕士.
[32]方舒彦.汉画装饰符号分析[D].杭州师范大学,艺术学,2007,硕士.
[33]李蓓.我国注册会计师审计质量问题研究[D].山西财经大学,会计学,2014,硕士.
[34]张笑.焦炉工外周血淋巴细胞微核率与尿中多环芳烃代谢物、血浆BPDE-白蛋白加合物的关联及其在工人早期健康监护中的应用[D].华中科技大学,劳动卫生与环境卫生学,2013,硕士.
[35]陈丹丹.高速道岔振动信号端点检测与失真识别研究[D].西南交通大学,信号与信息处理,2014,硕士.
[36]陈玉玲.莉芙敏治疗肾阴虚围绝经期综合征的疗效及与骨吸收水平的关系[D].福建中医药大学,中西医结合临床(专业学位),2014,硕士.
[37]张莉.版面编排设计在城市视觉导向系统中的运用[D].安徽工程大学,平面艺术设计,2012,硕士.
[38]姜晓芳.小学生书法学习心理研究[D].聊城大学,艺术学,2014,硕士.
[39]王敏.基于粗糙集和支持向量机的财务危机预警模型研究[D].西安电子科技大学,计算机技术,2011,硕士.
[40]王海潮.论温福铁路在路网中的合理定位[J].铁道经济研究.2001(05)
[41]魏玥祥.坚持系统性提高可操作性——浅议质量手册的编制[J].质量与可靠性.1996(01)
[42]梁鸿艳.董事注意义务中商业判断规则的问题研究[D].北京化工大学,民商法学,2013,硕士.
[43]周璇.潍坊市流脑监测信息管理系统的设计与实现[D].山东大学,软件工程(专业学位),2013,硕士.
[44]张小凤.我国信贷市场脆弱性问题研究[D].江西财经大学,国民经济学,2004,硕士.
[45]程嘉煜.基于机器视觉的农业机器人运动障碍检测及避障策略研究[D].南京农业大学,机械电子工程,2011,硕士.
[46]梁国亮.资源枯竭地区发展战略研究[D].山东师范大学,工商管理(专业学位),2012,硕士.
[47]陈青.20世纪以来美国政府印第安民族政策演变研究[D].宁夏大学,中国少数民族史,2014,博士.
[48]何平.西昌XX住宅项目施工过程管理研究[D].西南交通大学,项目管理,2012,硕士.
[49]王晓楠.汉日情感隐喻对比研究[D].西北师范大学,外国语言学及应用语言学,2013,硕士.
[50]栾文力.直升机飞行控制系统直接自修复控制方法研究[D].南京航空航天大学,检测技术与自动化装置,2013,硕士.

相关推荐
更多