首页

事件关系识别关键技术研究 06月30日

【摘要】事件是一种描述特定人、物、事在特定时间和特定地点相互作用的客观事实(也称“自然事件”)。文本信息中的事件则指这一客观事实诉诸文字的独特语用形式,多见于新闻报告、评论或者博文中。然而,自然事件的发生往往不是孤立现象,其发生与发展往往与外在的其它自然事件有着本源的逻辑关系。从而,形成一种自动识别和检测事件关系的自然语言分析和信息处理机制,对于面向大规模信息流中的离散事件,实现话题推演和话题预测 […]

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

信息抽取中中文命名实体识别技术的研究 07月18日

【摘要】信息抽取的目的是将文本中的信息按照需求进行提取,并将需要的信息进行结构化表示。在信息抽取的各个关键技术中,命名实体识别是一项重要而且基础的技术。命名实体是自然语言文本中最基本的单位,是文本中的固有名称和唯一标识,只有保证对命名实体的准确识别,才能对正确理解文本进行保证。命名实体识别是指对文本中命名实体的识别,在中文命名实体识别中这一过程通常为分词和命名实体标注。命名实体识别是自然语言处理领 […]

正则表达式在网页数据采集的应用与研究 10月02日

【摘要】随着Internet的快速发展与普及,人们越来越习惯于通过各种终端(PC、平板、手机等)从互联网来获取信息。基于Web的信息抽取技术就是研究从这些Web网页中如何定制提取出用户需要的信息,并把这些提取出的信息结构化处理。本文的主要工作是采用基于正则表达式的相关技术,以学术谷歌网站的论文采集以及澳客彩票网站的足彩投注数据采集分析两个应用为实例,给出Web网页信息的自动提取问题解决方法。在实现 […]