基于维基百科的概念图建模及其应用研究 07月25日
【摘要】文本的表征与文本间的语义相似度计算是自然语言处理领域里十分重要的基础性研究课题,它们直接影响着诸如文本自动分类、信息检索、机器翻译、问答系统等多个应用系统的效果。传统的机器学习方法仅仅使用了文本本身所提供的信息来建模和运算,面对复杂多变的网络用语和短文本,仅仅依靠文本自身所提供的信息来理解文本语义信息变得越来越困难。这是因为传统的机器学习方法大多数是基于词袋(Bagofwords)模型,即 […]
基于网络评论的话题挖掘 05月11日
【摘要】随着移动互联网的快速发展,我们逐渐步入大数据时代,越来越多的人可以将自己的观点、心情等信息发布到网络平台中。评论中蕴含有很大的信息量,商品评论可以分析得出评论者对商品的购买表示值得还是不值得;视频的评论可以反映观看者对于视频的态度或者情感表达;博文的评论可以反映评论者对博文的观点以及对博主的情感表达。通过分析评论,可以了解目标产品的市场情况、舆论热点的形成过程、人们的消费习惯等信息,对个人 […]
中文维基百科分类结构的复杂网络动力学研究 10月30日
【摘要】维基百科是一项人类集体智慧工程的结晶,是一个全世界使用最为广泛的百科全书,它既可以作为一个高质量的语料库,也可以作为词库和知识本体进行应用。对维基百科的分类结构进行研究,既可以验证它是否符合人类群体智能的规律,也可以探求人类对自身和社会的认知规律以及人类思维的潜在规律,有助于揭示知识结构的特征与进化规律。利用复杂网络理论可以对系统的结构和性质进行研究。本文从知识本体的角度对维基百科的分类结 […]