首页

基于Lucene的中文分词技术研究与实现 11月22日

【摘要】信息技术的快速发展推动了互联网的信息的不断丰富和搜索引擎技术的加速发展,作为信息检索之一的中文分词技术显得尤为重要,中文分词技术促进了全文检索技术的发展。Lucene便是随着这一过程而产生发展的。Lucene是由apache公司开发的一个开源工具包,其目的是为了实现全文检索。但在具体的实现上,它仍有很多改进的地方,尤其是在对中文信息的处理上。所以本文的研究重点是Lucene的中文分词技术。 […]

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

基于Lucene的全文检索系统的设计与实现 01月03日

【摘要】二十世纪九十年代开始,计算机技术和互联网技术获得了巨大的发展,随着计算机以及互联网技术的大规模普及应用,人们所接触到的信息量也呈现指数级的增长,信息量的增大迫使人们必须想出各种方法来快速获得所需要的有用信息,为此,人们发明了各式各样的信息查找技术,但是,如何才能快速高效地完成信息的存储以及查找操作呢,这是非常值得国内外读者去研究的课题。当前,搜索引擎已经成为信息网络化时代最主流的技术之一, […]

基于垂直搜索引擎的文本挖掘系统研究与实现 05月24日

【摘要】通用搜索引擎能够为人们提供针对海量信息的检索服务,搜索结果“广而全”,但是对于特定领域的搜索,通用搜索引擎往往不能满足人们“精而深”的检索需求。于是出现了越来越多的针对各个领域的垂直搜索引擎,满足人们对于特定领域的信息检索需求。而随着互联网技术的不断发展和普及,网络上的文本信息资源急剧增长,如何对这些网页中的信息进行文本挖掘就显得尤为重要。因此,针对特定领域的文本进行挖掘及相关的分析处理具 […]

基于移动终端的博客搜索引擎系统研究与应用 03月17日

【摘要】根据RSS/XML文本格式的博客信息特点,进行了文本解析、中文分词和索引建立,以及基于PageRank算法的搜索排序等研究工作,利用Heritrix爬虫、Lucene全文索引检索工具包开发了RSS博客搜索引擎,并将系统实际应用于Android系统的手机终端。实验证明,该系统能实时、高效的在手机终端进行博客搜索,使用户获得优于传统博客检索的体验。 【作者】陈建峡;李志鹏; 【机构】湖北工业大 […]