首页

多变量体数据的压缩技术研究 09月23日

【摘要】近几年来,随着移动计算和传感器设备的迅速发展,高维度多变量数据日益增多,例如互联网企业巨头阿里巴巴专注于电子商务多年,积累了海量的文本、视频类高维多变量数据,蕴含着巨大的商业价值。数据压缩技术是合理分析这些海量数据的关键一步,通过压缩可以去掉大量的冗余信息,以减小数据挖掘、可视化分析等科研任务的压力。但是传统的单一变量数据压缩技术无法处理这类海量数据,针对高维度多变量大规模数据集的压缩技术 […]

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

跨语言实体关系抽取研究 06月30日

【摘要】语料库的数量和质量对基于机器学习的命名实体间语义关系抽取的性能具有重要的影响,而语料库的人工标注是一项十分耗时又费力的工作。另一方面,多语言语料库的出现以及机器翻译技术的发展,为研究多种语言之间的一致性和互补性提供了良好的契机。本文提出了三种跨语言关系抽取的方法,旨在提高多语言关系抽取性能的同时降低对语料库标注量的需求。研究内容包括以下三个方面:1)基于机器翻译的跨语言关系抽取。首先利用机 […]

基于主动学习的高效社区挖掘算法 12月10日

【摘要】现实世界中,诸多复杂系统都可以由一个网络来进行抽象,如计算机邮件网络,生物学中的蛋白质网络,基因表达网络等。真实世界中的复杂网络普遍存在一些统计特征,例如“小世界网络特性”,“无标度特性”,“社区结构特性”等。其中社区结构的挖掘对于理解复杂网络的拓扑结构,分析复杂网络的功能,挖掘复杂网络隐藏的规律以及预测复杂网络未来的行为变化等都具有非常重要的理论意义和应用背景。近十年来,来自数学、物理学 […]