基于BTM的短文本聚类 06月04日
【摘要】随着互联网和网络技术的快速发展,很多网络通信交流平台被广泛使用,如手机短信、微博、电子邮件、论坛、聊天软件、新闻评论等,而他们通常会产生大批量的短文本信息资源。这些短文本涉及着人们生活的各个领域,也逐渐成为人们广泛使用并且公认的交流方式,并且它也改变着人们的生活和沟通习惯。从这些数量庞大的短文本中挖掘其中所蕴含的潜在资源可以方便对它们进行管理、同时也可以用于信息的发现和分析。但是面对如此海 […]
基于特征抽取和转换方法的全文检索研究 07月22日
【摘要】在信息检索技术随着互联网的迅猛发展而日趋成熟的同时,搜索引擎也已经成为人们日常生活中越来越不可缺少的重要工具和手段。传统的信息检索是在基于关键词匹配的基础上,机械地匹配仅仅包含有指定关键词的文档来获得相关文档,这种方式常常会带来语义理解上的错误,越来越不能满足现状用户的需求和科学研究的需要,于是语义分析和挖掘显现了在检索中的重要性。由于汉语语言的二义性和相关性,在一定程度上造成了不确定性和 […]
基于共现词的中文微博观点句识别 05月10日
【摘要】近年来,随着计算机移动技术和社会媒体的发展,微博已经成为一个热门的信息交流平台。但是由于微博平台中的数据量非常庞大,在这样浩瀚的数据海洋中提取出带有观点的句子不是一件容易的事情,所以如何提取出带有用户观点的句子也越来越受到关注。但是,目前的中文微博观点句提取方法都集中在使用句法分析与分类器,忽略了微博主观信息所具有的内容关联性。因此,本文将传统观点句识别方法与共现词相结合,提出了基于内容共 […]
基于主题和结构的微博社区挖掘方法研究 08月22日
【摘要】近几年,随着互联网的兴盛,在线社交网络(Onlinesocialnetwork,OSN)蓬勃发展。其中,微博(Microblog)作为一种全新的社会化媒体工具和网络交流工具,以其“短、平、快”的特点迅速捕获大众的青睐。目前我国微博用户已经超过3亿人,将近占我国互联网用户的一半,全球排名第一。面对如此庞大的用户群,无论是网络管理者还是使用者都面临着许多全新的机遇和挑战。用户如何在茫茫人海中找 […]
中文短文本分类技术的研究与实现 07月26日
【摘要】文本分类是文本挖掘领域的一门重要学科,是指在已知的分类体系中,根据已知文本内容自动确定未知文本类别的过程,文本分类在一定程度上帮助用户处理获得的杂乱信息,有助于用户根据自己的倾向有选择地阅读海量的文本。目前多数情况下,文本分类大多是对于长文本进行分类,所处理的文本包含比较多的信息。然而,随着互联网的飞速发展,越来越多的短文本出现在生活中,由于短文本包含的信息量有限,传统的处理长文本的分类方 […]
基于主题模型的动态场景分类 06月30日
【摘要】场景分类是指根据特定意义对图像数据集进行自动标注,是当前计算机视觉领域的一个研究热点。本文以动态场景为研究对象,以视觉词包-语义主题建模-动态场景语义分类为主线,研究基于主题模型的动态场景分类方法。研究内容主要包括动态场景视觉词典的构建,基于先验知识的消息传递主题模型建模以及动态场景语义分类的实现。论文的主要工作如下:1、针对现有主题语义场景分类方法大多局限于静态图像集,视觉单词生成方法不 […]
基于主题模型的人物行为识别 06月30日
【摘要】人物行为识别是计算机视觉领域研究的基础任务和关键技术之一,被广泛应用于智能视频监控、高级人机交互、视频会议、基于行为的视频检索以及医疗诊断等。因此,研究人物行为特征描述方法并进行行为识别具有理论意义和实际应用价值。论文针对实际场景中由于运动目标和背景复杂带来的行为描述和后期识别困难问题,展开了动态场景下的人物行为识别研究。其主要工作创新体现在:1)针对复杂和动态背景容易造成兴趣点误检,影响 […]


