基于半监督学习的隐式篇章关系识别与研究

基于半监督学习的隐式篇章关系识别与研究

作者:师大云端图书馆 时间:2018-11-30 分类:硕士论文 喜欢:3542
师大云端图书馆

【摘要】篇章关系自动识别是自然语言处理领域一项非常具有挑战性的任务,该任务通过挖掘自然语言文本之间的结构信息、语义信息和词信息等来识别文本单元之间的逻辑关系,对自动问答系统、机器自动文摘、文本蕴含等都具有十分重要的实践和指导意义。根据文本单元中是否存在连接词可将篇章关系分为显式篇章关系和隐式篇章关系两种。显式篇章关系仅仅根据连接词就可以轻易分辨出文本之间的关系,而隐式篇章关系由于连接词的缺失使得其自动识别成为一个难点。目前,隐式篇章关系识别主要采用有监督机器学习的方法,对候选关系实例的表示也处于探索阶段。然而有监督学习需要大量的人工标注数据来增强模型的可靠性和健壮性,考虑到人工标注数据难度大、代价高的困境,本文首次提出基于自训练和互训练的半监督策略来识别隐式篇章关系,并对候选关系实例的表示进行了进一步探索。本文研究内容主要包括三部分:(1)用ThePennDiscourseTreebank(PDTB)2.0作为研究载体,提取First-Last-First3、InquirerTags、产生式规则、依赖式规则、词的极性,动词特征、情态动词、实体特征、一元词对特征共9种特征以及特征之间的组合来表示候选关系实例。(2)用有监督的方法对隐式篇章关系进行分类,实验结果表明,结构信息和语义信息相结合能取得比单一特征更好的效果。我们的结果比baseline提高了一到两个百分点。(3)根据有监督的实验结果,选取效果最好的组合特征构建基于自训练和互训练的半监督模型,利用少量标注数据和大量的无标注数据来识别隐式篇章关系,并对不同大小的标注数据集下的有监督模型、自训练模型、互训练模型的实验结果进行对比。结论表明,少量标注数据的情况下,半监督策略能取得更好的效果。
【作者】刘初;
【导师】陈锦秀;
【作者基本信息】厦门大学,计算机系统结构,2014,硕士
【关键词】隐式篇章关系识别;半监督;PDTB;

【参考文献】
[1]赵伟超.外周血smMHC、sELAF、D-dimer对于急性主动脉夹层诊断的临床意义[D].河北医科大学,外科学,2013,硕士.
[2]程伟.少齿数齿轮传动强度分析与参数设计[D].陕西理工学院,机械设计及理论,2013,硕士.
[3]崔国雄.中青年急性心肌梗死(AMI)临床特点分析[D].延安大学,内科学,2014,硕士.
[4]曹昊晨.庄子与嵇康人生哲学比较研究[D].南京大学,宗教学,2013,硕士.
[5]房业欣.玉米高亲和钾转运体基因ZmHAK1的功能验证[D].吉林大学,植物营养学,2013,硕士.
[6]刘燕.基于E-DCH信道的HSUPA相关技术的研究[D].北京邮电大学,电子与通信工程(专业学位),2013,硕士.
[7]郑常科.公路隧道照明节能控制软件设计及实现[D].长安大学,交通信息工程及控制,2013,硕士.
[8]李光磊.QGP相变中粒子关联与强子化机制的研究[D].华中师范大学,理论物理,2014,硕士.
[9]苏志森.采取措施降低6300球铁曲轴铸件废品率[J].柴油机.1991(05)
[10]司志龙.GP73和AFP在早期肝细胞癌组织中的表达及意义[D].华中科技大学,普外科,2013,硕士.
[11]颜建华.8-硝基喹啉类光解基团的合成、光解性质及机理的研究[D].北京化工大学,化学工程与技术,2013,硕士.
[12]李经振.数据挖掘:统计学的分支?[J].江苏统计,2002,09:7-8.
[13]黄巧.我国运动性疲劳与超量恢复理论沿革研究[D].西南大学,职业技术教育学,2012,硕士.
[14]中圣信息技术有限公司李辉.数据挖掘在CRM中的作用[N].中国计算机报,2001-04-16E12.
[15]郭春杰.太阳能空气集热器热性能的实验和模拟研究[D].郑州大学,化工过程机械,2013,硕士.
[16]董兆成.回溯机制的掠食粒子群算法研究[D].燕山大学,计算机应用技术,2014,硕士.
[17]秦鑫.旅游管理网站系统的设计与实现[D].大连理工大学,计算机技术(专业学位),2013,硕士.
[18]李昭.铁路干线传输网优化方案研究[D].大连理工大学,电子与通信工程(专业学位),2012,硕士.
[19]姚成林.推进我国省直管县改革探讨[D].福建师范大学,政治学理论,2012,硕士.
[20]张红光,姚宝峰,刘中良,纪常伟,夏国栋,吴斌.促研究性学习提高人才培养质量[J].实验室研究与探索,2014,01:177-181.
[21]金涛涛.混合动力传动系统建模及优化控制研究[D].北京交通大学,2014.
[22]郎需强.基于微多普勒效应的昆虫运动雷达回波特性研究[D].山东农业大学,农业机械化工程,2014,博士.
[23]戴习兵.基于FPGA的卫星天线机载“动中通”倾角测量的分析与设计[D].南京邮电大学,通信与信息系统,2013,硕士.
[24]朱志萍.论卢卡奇的辩证总体观[D].华东师范大学,马克思主义哲学,2001,硕士.
[25]刘华平,孙富春,何克忠,孙增圻.基于迭代线性矩阵不等式的奇异摄动系统同时镇定(英文)[J].自动化学报,2004,01:1-7.
[26]张立波.视觉图形的意象性研究[D].大连工业大学,设计艺术学,2009,硕士.
[27]弓仲冬.儿童作为目击者利他说谎行为的研究[D].首都师范大学,学前教育,2013,硕士.
[28]牛忠海,贾元华,张文学,张东华,钟江.电子商务条件下的铁路货运物流信息化研究[J].铁道货运,2015,02:1-6.
[29]李海峰.基于抽样估计的MapReduce负载平衡研究[D].大连海事大学,软件工程,2014,硕士.
[30]郭贵堂.一种新型的海上遇险报警和搜索营救系统[J].电讯技术.1991(01)
[31]李纪翔.漳州近代骑楼立面研究[D].华侨大学,建筑历史与理论,2014,硕士.
[32]杨超.大承气汤治疗内毒素血症血中移行成分的药效学比较研究[D].西南交通大学,中药学,2012,硕士.
[33]邴纪全.基于民生改善的农村新型社区建设研究[D].天津商业大学,行政管理,2013,硕士.
[34]刘东琴,苏山舞.多空间数据库位置匹配方法及其应用[J].测绘科学,2005,02:78-80+7.
[35]夏亚莉.兰州地区机械加工厂房太阳能热风供热系统的数值模拟研究[D].兰州理工大学,供热、供燃气、通风及空调工程,2014,硕士.
[36]田稷.图书馆多粒度个性化信息服务[J].情报杂志,2003,07:39-40+43.
[37]马国俊.潜在语义索引在中文文本聚类中的应用研究[D].西安建筑科技大学,2004.
[38]郝钢.基于WEB的校友管理系统的设计与实现[D].电子科技大学,软件工程(专业学位),2012,硕士.
[39]刘大峰.基于点云的口腔修复体曲面测量与重建基础技术研究及应用[D].南京航空航天大学,2007.
[40]朱玲.新公共管理视角下纳税服务优化研究[D].华中师范大学,公共管理,2013,硕士.
[41]李华琦.金融资产和住房资产财富效应的研究[D].浙江工商大学,金融学,2013,硕士.
[42]郭庆寅.丹参酮ⅡA诱导急性早幼粒细胞性白血病细胞株(NB_4细胞)分化机制的研究及与ATRA和As_2O_3的比较[D].郑州大学,儿科学,2013,博士.
[43]莫勇芳.高分子链在纳米体系表面取向行为的分子动力学模拟[D].鲁东大学,原子与分子物理,2014,硕士.
[44]周婷子.麻省理工学院创业教育研究[D].吉林大学,高等教育学,2014,硕士.
[45]张云辉.栾川地区晚中生代构造—岩浆演化与成矿关系探讨[D].中国地质大学(北京),构造地质学,2014,硕士.
[46]王晓巍,陈慧.基于利益相关者的企业社会责任与企业价值关系研究[J].管理科学,2011,06:29-37.
[47]张树鹏,宋海欧.β-环糊精功能化石墨烯的制备及热稳定性的增强[J].高等学校化学学报,2012,06:1214-1219.
[48]吴那仁朝格图.搏克竞赛规则演变研究[D].内蒙古师范大学,民族传统体育学,2012,硕士.
[49]张译心.Leber遗传性视神经病变临床特点及光学相干断层扫描特点[D].中国人民解放军医学院,眼科学,2013,硕士.
[50]许阳.基于碳纳米管可饱和吸收体的全光纤1μm全正色散锁模激光器的研究[D].吉林大学,2014.

相关推荐
更多