首页

基于Lucene的中文分词技术研究与实现 11月22日

【摘要】信息技术的快速发展推动了互联网的信息的不断丰富和搜索引擎技术的加速发展,作为信息检索之一的中文分词技术显得尤为重要,中文分词技术促进了全文检索技术的发展。Lucene便是随着这一过程而产生发展的。Lucene是由apache公司开发的一个开源工具包,其目的是为了实现全文检索。但在具体的实现上,它仍有很多改进的地方,尤其是在对中文信息的处理上。所以本文的研究重点是Lucene的中文分词技术。 […]

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

基于排序主题模型的自动文摘及评价系统 12月07日

【摘要】随着时代的发展与进步,计算机及互联网成为人们生活中必不可少的一部分,大量信息随着互联网技术的迅猛发展以电子文本的形式出现在人们面前。如何快速、准确地从大量无结构化的文本中获取人们需要的信息成为研究的热点和难点。人们越来越希望用简练的文字表达大量相关文本的主要内容,从而减少获取有用信息的时间。自动文摘技术就是解决这一问题的有效工具。主题模型在自动文摘中被广泛应用,通过得到的主题分布抽取原文中 […]

基于领域本体的垂直搜索引擎页面排序算法的研究 07月17日

【摘要】伴随着网络信息资源的剧增,搜索引擎的重要性与日俱增。网页排序算法是检索引擎关键部分。如何有效的查找需要的信息是非常关键的,一个好的搜索引擎可以极大的节省用户查找信息的时间。搜索引擎包含多个组成部分,其中网页排序结果的准确率直接决定了搜索引擎的性能和用户体验。信息检索领域中有许多的网页排序算法,其中基于链接分析的算法运用比较广泛。通过对垂直搜索引擎的工作原理与架构、本体等相关技术的研究,在此 […]

单GPU及GPU异构集群的若干关键技术研究 11月19日

【摘要】现代GPU由于其超强的计算能力、高速访存带宽、高数据级并行体系结构等特点,作为高性能运算部件在集群计算环境中得到广泛应用,并且GPU异构集群正在逐渐成为高性能计算应用领域的主流分布式计算平台,并使现代计算技术正在逐渐进入数据级并行计算的时代。数据级并行计算能否在实际应用领域得到越来越广泛的采用,不仅仅取决于所设计和实现的数据级并行算法是否能够在当前的硬件计算环境中获取较高的计算能力,更为基 […]