信息抽取中中文命名实体识别技术的研究

信息抽取中中文命名实体识别技术的研究

作者:师大云端图书馆 时间:2019-07-18 分类:硕士论文 喜欢:2125
师大云端图书馆

【摘要】信息抽取的目的是将文本中的信息按照需求进行提取,并将需要的信息进行结构化表示。在信息抽取的各个关键技术中,命名实体识别是一项重要而且基础的技术。命名实体是自然语言文本中最基本的单位,是文本中的固有名称和唯一标识,只有保证对命名实体的准确识别,才能对正确理解文本进行保证。命名实体识别是指对文本中命名实体的识别,在中文命名实体识别中这一过程通常为分词和命名实体标注。命名实体识别是自然语言处理领域的基础技术和关键技术,在许多相关领域起重要作用,如信息抽取、文本分类、信息检索和自动问答等。中文命名实体识别在中文信息处理中占据关键地位,近年来这一技术在各个领域的应用越来越广泛,中文命名实体识别的应用价值也越来越高。本文主要从若干网页的文本中,进行人名、地名和机构名的命名实体识别研究。主要研究内容包括:1.对中文命名实体识别进行介绍,并对其中的人名、地名和机构名的识别难点进行了详细分析和研究。2.通过隐马尔科夫模型和分级时序记忆模型对命名实体识别的测试。隐马尔科夫统计模型经过多年的应用,在效率和实现的成熟度上都较为优秀,而分级时序记忆模型是近年来出现的较为优秀的一种机器学习方法。3.对隐马尔科夫模型和分级时序记忆模型针对命名实体识别测试的实验结果进行分析和比较。隐马尔科夫统计模型经过多年的研究,经过调优之后可以得到较好的性能,但是传统的隐马尔科夫统计模型并没有充分的利用文本中的上下文信息。本文引入分级时序记忆模型进行中文命名实体识别,提高了实体识别的性能和效率。实验证明分级时序记忆模型可以较好的适用于中文命名实体识别。
【作者】崔向阳;
【导师】王小玉;
【作者基本信息】哈尔滨理工大学,计算机应用技术,2012,硕士
【关键词】信息抽取;中文命名实体识别;分级时序记忆模型;隐马尔科夫模型;

【参考文献】
[1]张刘正.Android系统下软件的自动化测试框架(本地化平台)的研究与实现[D].西南交通大学,软件工程,2012,硕士.
[2]庞钰洁.歌剧《刘胡兰》的艺术特征及其唱段分析[D].西安音乐学院,声乐表演,2014,硕士.
[3]刘小平.三维超声心动图最佳切面自动检测.上海交通大学,2009.
[4]杨尚强.基于大气偏振中性点的地—气分离空基验证[D].首都师范大学,计算机应用技术,2014,硕士.
[5]苟文蓉.操控论观照下葛浩文英译《天堂蒜薹之歌》研究[D].西北师范大学,英语语言文学,2014,硕士.
[6]王亮.GT公司发展战略研究[D].山东大学,工商管理(专业学位),2013,硕士.
[7]孙博宇.葡北三断块精细挖潜示范区砂体细分注采组合模式研究[D].东北石油大学,油气田开发工程,2013,硕士.
[8]牛青,莫蓉,万能.基于典型相关分量组的多元工序质量相关性诊断算法[J].计算机集成制造系统.
[9]郭志涛,郭忠,王振.基于Android平台的智能医疗系统的设计与实现[J].郑州大学学报(工学版),2014,06:60-63.
[10]黄静.学龄前儿童社会退缩行为与家庭教养方式、亲子依恋及同伴接纳的关系[D].沈阳师范大学,应用心理学,2013,硕士.
[11]余勇.矮牵牛PhTCP3、PhTCP4基因功能的初步研究[D].西南大学,园艺学,2014,硕士.
[12]胡星星.新疆乌鲁木齐河水环境质量评价及污染防治对策研究[D].新疆农业大学,水力学及河流动力学,2012,硕士.
[13]杨敏.基于数码显微互动教学系统的初中生物实验探究[D].山东师范大学,教育(专业学位),2013,硕士.
[14]刘乃新.气液弹射机构的设计及关键控制元件的研究[D].浙江工业大学,2009.
[15]龚雪文.干旱区膜下滴灌条件下套种农田水热特性研究[D].内蒙古农业大学,水利工程,2013,硕士.
[16]宋少群.适用于多种通讯方式的远程电能校准装置管理系统研究[D].华北电力大学(河北),电力系统及其自动化,2004,硕士.
[17]张莎莎.特留份制度研究[D].郑州大学,法律,2013,硕士.
[18]周荟.19p13.1染色体上双基因单核苷酸多态性与三阴性乳腺癌的相关性研究[D].吉林大学,临床医学,2013,硕士.
[19]杨军.低电压电磁铆接过程数值模拟研究[D].武汉理工大学,材料加工工程,2004,硕士.
[20]丁玉琪,武君胜.商业智能在医院信息系统数据深加工中的应用[J].中华医院管理杂志,2005,04:250-252.
[21]王磊,杨洪耕.基于Laguerre多项式的谐波求和问题[J].电力系统自动化,2005,04:40-44.
[22]欧阳斌.工程网络计划进度风险分析及关键链进度计划法研究[D].天津大学,水工结构工程,2004,硕士.
[23]李智勇.面向绿色制造的齿轮滚切加工工艺规划及其应用[D].重庆大学,机械工程,2003,硕士.
[24]王贵彪.拖网渔船导管桨—舵干扰的水动力性能研究[D].浙江海洋学院,捕捞学,2013,硕士.
[25]张莉.垂直搜索引擎中分词和排序技术的研究与应用[D].西南交通大学,软件工程,2014,硕士.
[26]江宁.不确定时滞系统的稳定性分析和综合[D].中国科学技术大学,控制理论与控制工程,2014,硕士.
[27]刘晓燕.焦油模型化合物的催化裂解及析炭的实验研究[D].华中师范大学,高分子化学与物理,2013,硕士.
[28]徐代宇.相对论情况下的量子隧穿时间[D].华东师范大学,理论物理,2013,硕士.
[29]王琪.新建地方本科院校的就业指导服务中心建设研究[D].中南民族大学,公共管理(专业学位),2013,硕士.
[30]林现庆,陈曦,倪军.二维硼碳基纳米结构上的吸附及其性质[J].计算物理,2014,03:253-270.
[31]罗夏希.A房地产公司人力资源部绩效考核研究[D].广东工业大学,工商管理,2014,硕士.
[32]俞江虹.动态资源管理视阈下OMSS项目计划与控制研究[D].南京邮电大学,项目管理(专业学位),2013,硕士.
[33]陈菊芬.农村中小学体育特色课程资源的开发研究[D].宁波大学,教育管理(专业学位),2013,硕士.
[34]刘玮.关于中国货币政策的研究——论货币政策的信用传导渠道[D].首都经济贸易大学,政治经济学,2004,硕士.
[35]马明.贝叶斯网络算法研究及应用[D].燕山大学,电路与系统,2014,硕士.
[36]何腊梅.航空瞬变电磁数据时频分析及去噪方法研究[D].成都理工大学,信号与信息处理,2013,硕士.
[37]周挺辉,赵文恺,严正,徐得超,江涵.基于图形处理器的电力系统稀疏线性方程组求解方法[J].电力系统自动化,2015,02:74-80.
[38]吴慧姣.海外汉语教师志愿者教学效能感研究[D].山东大学,对外汉语,2013,硕士.
[39]周礼平.铰式锚张拉预应力碳纤维板的工艺研究[D].重庆交通大学,桥梁与隧道工程,2012,硕士.
[40]丁胜锋,逄玉俊.支撑向量机及其在数据挖掘中的应用[J].计算机与数字工程,2005,11:158-160.
[41]欧雅萍.法律如何应对非正常信访行为[D].华侨大学,法律,2013,硕士.
[42]肖立刚.Z公司供应商评价体系改进研究[D].南京理工大学,物流工程,2012,硕士.
[43]王晓伟.中国民间艺术人物造型在纤维壁挂中的研究与运用[D].西南交通大学,艺术设计(专业学位),2013,硕士.
[44]孔智贤.龙牡治湿汤治疗湿热型湿疹的临床研究[D].北京中医药大学,中医皮肤科,2013,硕士.
[45]袁将.基于CC2430远程医疗监护系统的设计研究[D].厦门大学,模式识别与智能系统,2014,硕士.
[46]李宏平.南高丛越橘品种“V_3”(Vaccinium austral)四倍体诱导及鉴定[D].西南大学,园林植物与观赏园艺,2013,硕士.
[47]周建国.民事审前准备程序之探讨[D].湖南师范大学,法学理论,2004,硕士.
[48]武彩霞.电梯群的智能控制[D].辽宁工程技术大学,控制理论与控制工程,2004,硕士.
[49]陈丽珍.乔·卡巴金的“正念修行”心理治疗探析[D].华侨大学,宗教学,2013,硕士.
[50]徐斌.校园信息环境建设的调查与思考[D].华东师范大学,教育管理,2003,硕士.

相关推荐
更多