文本概念语义空间模型及其应用研究

文本概念语义空间模型及其应用研究

作者:师大云端图书馆 时间:2015-10-05 分类:期刊论文 喜欢:2132
师大云端图书馆

【摘要】概念比关键词具有更大的语义粒度,包含更多的语义信息,用于本体构造、文本的语义表示和语义标注、语义搜索等,以提高文本语义处理的效率。概念语义处理的效果直接影响文本语义处理的效果和效率。在面向文本集的概念语义处理领域,目前研究主要关注概念语义处理算法本身,很少关注文本概念语义的一些基本问题,例如,文本概念形成的条件是什么?一个文本概念用多少关键词表示才经济合理?文本概念语义演化的动力和规律是什么?这些问题涉及到文本概念语义运动的基本规律,能够为文本概念语义处理的各种具体算法提供方法论的指导,所以关于概念基本规律的研究和具体算法的研究一样重要。本文借鉴热力学定律和耗散结构理论的基本思想,面向Web文本语义处理的应用领域,提出文本概念语义空间(TextualConceptSemanticSpace,TCSS)作为概念语义运动和演化的空间,通过对该空间的宏观和微观研究,初步揭示了概念语义运动的基本规律,能够为各种文本概念语义处理研究提供支持和参考。本文的具体研究内容包括:1.通过类比热力学系统和概念语义系统以发现两者的相似之处,并据此提出文本概念语义空间(TCSS)模型,通过类比热力学系统和TCSS建立起两者之间的联系,为TCSS的研究确立了理论工具。2.在对TCSS定量分析的基础上,基于热力学基本定律,提出TCSS信息熵收敛定理、TCSS信息熵计算方法、TCSS信息交换的信息熵计算方法,共同构成了TCSS的基本性质,初步揭示了文本概念语义运动的一般规律。同时基于以上性质定理提出一种无先验知识和人工参与的TCSS的构建方法,可应用于文本概念提取、本体自动构造、以及文本语义标注等方面。3.利用领域中存在的少量先验知识对TCSS的构造过程进行优化,以提高TCSS的精度,为基于TCSS的各种应用提供更好的支持。首先,提出一个通用的基于先验知识指导的算法优化模型,为TCSS构造过程各环节的算法优化提供方法论指导;然后,使用该模型对TCSS构造主要环节的算法进行优化,具体包括在先验知识指导下提高关键词提取算法的精度,提高关联规则挖掘的精度,对关键词关联语义链网络的构造进行优化和提高概念层次树生成算法的精度,最终实现TCSS的优化。4.基于耗散结构理论,对TCSS进行耗散结构建模,以研究概念的形成和语义演化过程。提出TCSS耗散结构形成的定量判断方法;初步揭示了TCSS中概念演化的动力;对概念演化过程中宏观和微观演化现象进行了分析;初步揭示了文本概念语义演化的基本规律;并对TCSS耗散结构在非常规突发事件检测中的应用进行了讨论。5.基于TCSS给出两个具体应用研究:(1)大规模概念语义标注测试数据集的构造:为解决文本概念语义标注研究中测试数据集规模偏小、无法对标注算法的效率进行全面评价的问题,基于TCSS思想,以MeSH医学主题词表和PubMed医学论文数据库为数据源,构造了一个较大规模的文本语义标注测试数据集,并基于该数据集给出了算法的评价参照标准,为文本语义标注研究提供支持。(2)网页集分面自动提取:基于TCSS思想,提出网页集的多维语义索引结构(MDSI),实现了对网页集的富含语义的索引组织;通过分析MDSI中不同语义维度的映射关系实现了分面的自动提取,一定程度上解决了海量非结构化文本的分面自动提取问题,能够为分面搜索提供支持。本文的研究内容初步揭示了文本概念语义活动的基本规律,同时也为文本概念的研究提供一些具体的方法和算法,可直接应用于面向文本集的概念提取和表示、本体构造、文本的语义表示、文本的语义标注、语义搜索、Web事件监测、分面搜索等方面,以提高Web的使用效率。
【作者】魏晓;
【导师】李青;骆祥峰;
【作者基本信息】上海大学,计算机应用技术,2014,博士
【关键词】文本概念语义空间;热力学系统;耗散结构;概念语义演化;大规模数据集;分面搜索;

【参考文献】
[1]高静.政府信息公开诉讼研究[D].苏州大学,法律(专业学位),2014,硕士.
[2]何菲.上海市嘉定区JDM项目定位研究[D].西南交通大学,工业工程,2012,硕士.
[3]陈晓炜.土地投资风险分析研究[D].河北农业大学,水利水电工程,2004,硕士.
[4]魏元锐.关于开发利用太西煤的几点建议[J].煤炭加工与综合利用.1988(04)
[5]王家惠.移动云计算下位置服务数据管理与应用研究[D].大连海事大学,软件工程,2013,硕士.
[6]刘习飞.论刑事证明标准[D].安徽大学,法律,2003,硕士.
[7]池诏丞.大鼠肝脏缺血预处理中一氧化氮和内皮素对微循环的调节作用[D].吉林大学,外科学,2004,硕士.
[8]王帅.理论研究碘掺杂对聚合物导电性能的影响[D].西南大学,物理化学,2014,硕士.
[9]李保新.市级会计培训中心机群系统的构建[D].复旦大学,软件工程,2012,硕士.
[10]朱克锦.“生活大爆炸”中的话语标记语WELL的语用研究[D].安徽大学,英语语言文学,2014,硕士.
[11]卢鹏.基于图像分析的海冰几何参数和拖曳系数参数化研究[D].大连理工大学,2007.
[12]陈华.酒店管理系统设计与实现[D].电子科技大学,软件工程(专业学位),2012,硕士.
[13]马铭.我国生产性服务业吸纳就业能力与结构优化研究[D].湖南科技大学,应用经济学,2013,硕士.
[14]赵荣生.同行评审在打印机可用性测试中的应用研究[D].湖南大学,设计学,2012,硕士.
[15]王茜,任冬雪,李涛,魏晓琳.纳米材料液相控制合成法及生长机理研究进展[J].化工管理,2015,16:219-220.
[16]亓明永.强激光辐照光电探测器非线性性能研究[D].青岛科技大学,检测技术与自动化装置,2012,硕士.
[17]王光宗.抗疲劳光导纤维[J].光通信研究.1990(04)
[18]陈德华.氽管原因与防止方法[J].城市公用事业.1997(04)
[19]柯琦.柔洁纺工艺参数对成纱质量的影响[D].武汉纺织大学,纺织工程,2013,硕士.
[20]陈学华,钟文丽,贺振华,杨威.瞬时谱数据的谱加权自适应带通滤波融合[J].石油地球物理勘探,2012,03:452-456+357+518.
[21]尹艺霖.我国非政府组织在社会救助中的角色完善策略研究[D].东北师范大学,社会保障,2012,硕士.
[22]林湘宁,徐雨舟,刘沛.相电流比例差动判据与线电流比例差动判据的比较[J].电力系统自动化,2005,03:21-25.
[23]李燕.论我国侦查阶段辩护制度的完善[D].华中师范大学,诉讼法学,2013,硕士.
[24]湛英杰.甜味剂三氯蔗糖合成新工艺的探索和优化[D].华中科技大学,化学工艺,2013,硕士.
[25]毛立佳.H股回归A股交叉上市企业的代理成本分析[D].东北财经大学,财务管理,2012,硕士.
[26]栗树和.网络时代的银行业[N].中国计算机报,2002-09-16B09.
[27]严美荣.草果遗传多样性分析及其混淆品的ITS序列差异比较研究[D].云南中医学院,中药学,2012,硕士.
[28]南辉,王冲,王刚,林红,韦浩民,王子玲.碳纳米管/环氧树脂复合纤维棉宏量制备及其吸油性能[J].化工学报,2015,03:1194-1200.
[29]刘纯毅.基于数据仓库技术的管控一体化研究[D].中国海洋大学,2003.
[30]陈玉霞.重庆集镇发展中的问题及对策研究[D].西南大学,农业经济管理,2013,硕士.
[31]彭亚.基于价值行为的商业地产项目定位评价研究[D].重庆大学,工业工程(专业学位),2014,硕士.
[32]薛辉.产业集群与区域物流协作模式研究[D].北京交通大学,2009.
[33]孟祥飞.功率自行车运动心率积分信度研究[D].河北师范大学,运动人体科学,2013,硕士.
[34]郭淑萍.城轨列车悬挂系统故障诊断研究及其工程实现[D].北京交通大学,2014.
[35]仕玉发.我国环境民事公益诉讼原告资格的设定[D].青岛大学,诉讼法学,2013,硕士.
[36]肖遥,陶冶,张元明.古尔班通古特沙漠4种荒漠草本植物不同生长期的生物量分配与叶片化学计量特征[J].植物生态学报,2014,09:929-940.
[37]樊凡.《大众日报》2010-2012年“三农”报道内容分析[D].华东师范大学,新闻学,2013,硕士.
[38]张美蓉.三种中药对MPP~+诱导人神经母细胞株SH-SY5Y细胞损伤的神经保护作用[D].华中科技大学,神经病学,2013,硕士.
[39]吴朝阳.互通式立体交叉分、合流端关键技术指标研究[D].长安大学,道路与铁道工程,2014,硕士.
[40]王晓丽.基于ARM的森林火灾图像分割方法研究与实现[D].黑龙江大学,信号与信息处理,2013,硕士.
[41]王海军.对华侵略与近代日本经济述论[D].曲阜师范大学,世界史,2013,硕士.
[42]杨淦程.京剧现代戏《华子良》创演成功经验初探[D].天津音乐学院,音乐学,2013,硕士.
[43]刘丹.辉瑞亚太财务共享服务中心发展战略研究[D].大连理工大学,EMBA(专业学位),2012,硕士.
[44]宋昀其.苏轼祈禳诗文研究[D].西北师范大学,中国古代文学,2014,硕士.
[45]罗光成.抗病毒治疗对慢性乙型肝炎患者淋巴细胞增殖功能和特异性T细胞免疫反应的影响[D].川北医学院,内科学,2013,硕士.
[46]金 浩,隋蒙蒙.京津冀协同发展过程中河北省产业承接力研究[J].河北工业大学学报(社会科学版).
[47]吴聿凡.中日同形异义四字成语的对比研究[D].吉林大学,外国语言学及应用语言学,2014,硕士.
[48]索南加乐,宋国兵,许庆强,王树刚,陈平.不受TV和TA传变特性影响的同杆双回线故障定位方法[J].电力系统自动化,2005,09:35-39.
[49]贺振华,赵宪生,陈琴芳.地震记录的快速f-k正演模拟[J].石油地球物理勘探,1992,03:336-342+430.
[50]赵云波.寒区农宅烟气余热地道式采暖方式研究[D].哈尔滨工业大学,供热供燃气通风及空调工程,2014,硕士.

相关推荐
更多