首页

基于微博文本的话题聚类研究与实现 10月25日

【摘要】Web2.0技术的出现推动了大数据时代的到来。以微博为代表的社会网络新媒体的兴起,在丰富了大数据的同时,也给数据挖掘和知识发现带来了诸多挑战,因为和传统的文本信息不同,微博信息涉及个人兴趣、娱乐、企业营销、公益宣传等多方面内容,且内容碎片化,数据量庞大。如何有效分析和挖掘其中的信息,成为当前一个重要的研究课题。话题聚类技术是微博研究的一项基础工作。它将海量的微博数据自动归类,使话题内容相近 […]