有色金属领域实体检索关键技术研究

有色金属领域实体检索关键技术研究

作者:师大云端图书馆 时间:2015-06-25 分类:开题报告 喜欢:3304
师大云端图书馆

【摘要】互联网中有大量的有色金属数据,这些数据大多是以结构化、半结构化或非结构化形式存在。快速、便捷、准确地获取这些数据对有色金属行业乃至整个商业市场有巨大的需求和重要的价值。目前,国内外还没有专门的针对有色金属领域的实体检索系统,本文针对有色金属领域的特点,结合信息检索中实体检索关键难点问题,围绕有色金属领域实体检索过程中的实体识别、实体关系抽取、实体证据文档识别以及实体排序等关键技术展开研究,主要完成以下特色工作:(1)针对有色金属领域产品、矿产、组织机构等几类实体结构复杂、嵌套性强等特点,提出了一种基于深度神经元网络(deepneuralnetwork,DNN)架构的有色金属领域实体识别模型。该模型将有色金属领域实体识别任务当作序列标注问题来处理,为了能利用有色金属领域实体中字符之间的紧密结合特征以及有色金属领域特征,模型首先通过wordembedding预训练将输入的中文字符表征为一个低维高密度的向量作为DNN模型的输入,然后由DNN模型的多个隐层的逐层预训练自动提取到最优的特征向量作为训练有色金属实体分类器的特征向量,最后在模型输出层通过有监督的神经元语言模型训练实现对有色金属领域实体的识别。实验结果表明针对本文定义的有色金属领域产品、矿产、组织机构这几类有色金属实体识别任务,提出的模型取得了较好的效果。(2)针对有色金属领域产品、矿产、组织机构等几类实体在文档中的关系特点,提出了一种基于深度信念网络架构(deepbeliefnetwork,DBN)的有色金属领域实体关系抽取模型。该模型首先将有色金属实体关系实例表征为wordembedding向量作为DBN模型的输入,然后通过DBN网络多个隐层的逐层训练得到有色金属领域关系实例对的有效特征向量,并作为训练有色金属领域实体关系识别分类器的特征向量,最后在训练有色金属领域实体关系抽取分类器的过程中利用已标注好的关系实例样本通过反向传播(backpropagation,BP)网络来不断优化整个DBN模型的参数,从而达到较好的关系分类效果。实验结果表明提出的方法针对有色金属领域实体之间的同类关系、生产销售关系、从属关系这三种关系类型的抽取任务具有较好的效果。(3)构建了有色金属实体证据文档识别无向图模型。首先分析各类有色金属实体证据文档中的词、URL链接、有色金属实体元数据等独立页面特征以及候选有色金属实体证据文档间的链接和内容等关联关系,然后将独立页面特征以及页面之间的关联关系融入到无向图中构建有色金属实体证据文档识别无向图模型,最后利用梯度下降方法学习模型中特征的权重,并利用吉布斯采样方法进行有色金属实体证据文档识别,实验结果表明所提方法有较好的效果。(4)提出了基于深度学习的有色金属实体排序模型。该模型首先通过深度网络的多层非线性变换分别将影响有色金属实体排序的查询向量、有色金属实体元数据向量、有色金属实体关系向量以及有色金属实体相关候选文档映射到同一个低维的语义空间向量,然后分别计算查询、有色金属实体元数据、有色金属实体关系与候选文档在变换后的低维语义空间中对应的向量之间的相似性,最后融合候选文档与这三个向量的语义相似性作为最终排序得分。实验结果表明我们的模型针对有色金属领域实体排序任务具有较好的效果。
【作者】毛存礼;
【导师】余正涛;
【作者基本信息】昆明理工大学,冶金控制工程,2014,博士
【关键词】有色金属领域;deepneuralnetwork;deepbeliefnetwork;wordembedding;实体识别;实体关系抽取;实体证据文档识别;实体排序;

【参考文献】
[1]陈玲.市场化进程中的产业同构演化趋势分析[D].天津财经学院,统计学,2004,硕士.
[2]胡慧.高校图书馆德育功能研究[D].华中师范大学,思想政治教育,2014,硕士.
[3]黄青武.氧化物/石墨烯纳米复合材料可控合成及其气敏与光催化性能研究[D].华中科技大学,2013.
[4]周凯.中小企业民间融资法律问题研究[D].西南政法大学,经济法(专业学位),2012,硕士.
[5]王亚琼,郭芹,刘咏,韦伟峰.溶液燃烧法制备Mn_3O_4/碳纸三维纳米多孔复合电极及其在超级电容器中的应用[J].粉末冶金材料科学与工程,2015,02:312-318.
[6]王仁忠,何安瑞,杨荃,王晓东,赵林.LVC工作辊辊型窜辊优化策略研究及应用[J].冶金自动化,2006,06:15-18.
[7]高飞.提高党的建设科学化水平研究[D].辽宁大学,科学社会主义与国际共产主义运动,2012,硕士.
[8]彭涛.GIS视景仿真系统设计与实现[D].大连理工大学,软件与理论,2004,硕士.
[9]闫枫,张明玉.京津城际高铁运营的综合影响力实证分析[J].经济问题,2015,05:117-120.
[10]T.A.Khan,罗维炳.数据采集的改进——“对地震地层学的回答”[J].石油地球物理勘探,1982,02:11-15.
[11]彭冲.胰岛素样生长因子1及其结合蛋白3对胃癌诊断的意义[D].青岛大学,临床检验诊断学,2013,硕士.
[12]牟丹.高校廉政文化建设研究[D].华中师范大学,公共管理,2012,硕士.
[13]王冬明.塔式起重机空间结构动力学分析及动态监测技术研究[D].太原科技大学,机械设计及理论,2014,硕士.
[14]王建荣.自身免疫性肝炎临床特点及中医药治疗疗效回顾分析[D].北京中医药大学,中西医结合临床,2014,硕士.
[15]章喜字.高校无线局域网的设计与安全分析[D].华侨大学,计算机技术(专业学位),2013,硕士.
[16]祝祖强.基于网络型产业规制理论的中国铁路收入清算研究[D].北京交通大学,2011.
[17]赵悦.《乐府传声》及其在现行声乐艺术中的借鉴研究[D].西安音乐学院,声乐教学与演唱,2014,硕士.
[18]范小雄.城门山铜矿投产初期露头矿的开采工艺[J].金属矿山.2003(03)
[19]朱春雨.改善民生的金融政策研究[D].吉林大学,马克思主义发展史,2014,硕士.
[20]周猛飞.草甘膦合成过程控制系统研究[D].浙江工业大学,2004.
[21]蒋湘辉.预览微软重头产品有去处TechEd2005中国大会将在穗沪京三地举办[J].每周电脑报,2005,33:51.
[22]闫旭光.吴起周湾—长城地区延长组长6、长8油层组沉积相及储层特征研究[D].西北大学,矿物学、岩石学、矿床学,2014,硕士.
[23]李景,季恒星,张星,王选芸,金智,王栋,万立骏.1-3层石墨烯的常压可控生长[A].中国化学会.中国化学会第29届学术年会摘要集——第30分会:低维碳材料[C].中国化学会:,2014:2.
[24]马强.强震观测数据实时处理方法的研究[D].中国地震局工程力学研究所,防灾减灾工程及防护工程,2002,硕士.
[25]马靖.出口贸易对企业规模分布的影响研究[D].大连理工大学,国际贸易学,2013,硕士.
[26]连佑群.武汉体育学院国家田径奥林匹克训练基地高水平后备人才培养模式研究[D].华中师范大学,体育教育训练学,2013,硕士.
[27]王静.不同地质背景生境下两种优势植物凋落叶分解研究[D].广西师范大学,野生动植物保护与利用,2013,硕士.
[28]刘林,阎贵平,辛学忠.京沪高速铁路地震预警系统的方案及关键参数研究[J].中国安全科学学报.2002(04)
[29]付会萍.无信号环形交叉口交通运行状况评价及改善措施研究[D].长安大学,交通运输规划与管理,2013,硕士.
[30]赵立军.基于MODIS数据的北京地区土壤含水量遥感信息模型研究[D].中国农业大学,土地资源管理,2004,硕士.
[31]李想.1000MW超超临界前后墙旋流对冲锅炉燃烧数值模拟[D].华中科技大学,热能工程,2012,硕士.
[32]肖佳.中国EFL学习者域映现能力与写作能力的关系研究[D].四川外国语大学,英语语言文学,2013,硕士.
[33]万洋.专利审查高速路机制的法律审思[D].华中科技大学,法律,2013,硕士.
[34]郭炜晨.基于OpenGL的DNA建模与展示[D].山东大学,计算机软件与理论,2013,硕士.
[35]张宁宁.新时期青少年思想政治教育文化环境研究[D].山西师范大学,马克思主义中国化研究,2014,硕士.
[36]丁浩,张星臣.石油企业实施HSE管理体系研究[J].中国安全科学学报,2004,10:58-61+3.
[37]姜姗.CD44和EpCAM分子在小鼠肝癌发生过程中的表达分析[D].广西医科大学,肿瘤学,2013,硕士.
[38]张凤.无监督颜色恒常性计算算法研究[D].燕山大学,信号与信息处理,2014,硕士.
[39]肖培涛.剪切对聚乳酸和聚乳酸/石墨烯复合材料结晶结构和结晶行为的影响[D].天津大学,2012.
[40]海晓伟.客运专线运力资源优化配置研究[D].北京交通大学,2014.
[41]张昊.累积复合轧制陶瓷/双相不锈钢复合材料的研究[D].兰州理工大学,材料学,2014,硕士.
[42]姜娜.内蒙古兴安盟乌兰浩特市小学思想品德课生活化教学研究[D].内蒙古师范大学,小学教育(专业学位),2012,硕士.
[43]习宁刚.云梯消防车稳定性的研究[D].西安建筑科技大学,机械设计及理论,2013,硕士.
[44]丁伯阳, 蒋佳琪.孔隙介质的时域BEM计算[J].应用数学和力学,2015,01:.
[45]曾珍珍.锦标赛机制对矿工不安全行为的影响研究[D].中国矿业大学,产业经济学,2014,硕士.
[46]陈琛.基于LTE异构网的网络优化技术研究[D].安徽大学,通信与信息系统,2013,硕士.
[47]杨逸舒.“V+下+去”带宾语研究[D].南京师范大学,中国语言文字学,2012,硕士.
[48]黄翀.数字动态应变仪的研究与设计[D].浙江大学,2006.
[49]潘蕴石.泛亚铁路网对我国国际物流的作用[D].大连海事大学,物流工程,2012,硕士.
[50]王海明.商业银行营业网点对公业务转型研究[D].山东大学,工业工程(专业学位),2012,硕士.

相关推荐
更多