首页

企业集团的智能搜索引擎平台的建立 09月02日

【摘要】通用搜索引擎的性质,决定了其不能满足特殊领域、特殊人群的精准化信息检索的需求。伴随着企业信息化快速发展,为企业量身定制企业级搜索引擎成为一种需求,企业搜索引擎也将成为信息化时代的一大研究热点。与通用搜索引擎相比,企业搜索引擎有着采集内容更丰富、安全系数更高、更高的查全率和查准率等特点:企业搜索引擎面向的数据不仅包括互联网上网页形式的数据,还包括企业内部数据库以及行业应用系统中的业务数据,而 […]

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

词的内部结构分析 06月30日

【摘要】词法分析是自然语言处理中最基础、最关键的步骤。在中文信息处理领域,词法分析的一般做法是通过分词给词和短语划定边界,从而使汉语的后续处理过程跟英语等西方语言基本一致。然而,汉语中词与短语之间的界限比较模糊,许多情况下,某些语言单位就连语言学家也很难确定是语素、词还是短语。这导致实践中人工标注的分词语料存在严重的不一致性,而这种不一致性无疑会制约汉语的后续处理工作。分词语料的不一致性不仅体现在 […]

组合型中文分词方法的研究 07月31日

【摘要】随着计算机技术的发展,人们已经进入了以网络为核心的信息时代,在这个信息急剧膨胀的社会里,如何获取和掌握有用的信息成为了个人、企业及政府关注的重点。在这种环境下,中文信息处理技术成为了科研人员研究和开发的热点,其中最重要的就是中文分词技术。中文分词是将没有特定分界符的汉字序列分割成符合特定语境下汉语语意的词序列的过程,它是中文信息处理的前提和基础,也是制约着中文信息处理技术发展的瓶颈。歧义的 […]

基于贝叶斯算法的垃圾邮件过滤系统设计与实现 01月18日

【摘要】伴随着互联网的大爆发,电子邮件成为人们日常沟通交流的重要方式,正是因为电子邮件有着无与伦比的优势像收发容易、操作简单、费用低廉等,所以众多网络用户将电子邮件列为他们的首选联系方式。然而伴随着网络邮件的发展,我们的邮箱经常会收到不认识的人或地址发来的邮件。这种邮件以各种广告信息为主例如免费通话、打折商品、各种非法信息等。这些邮件可能与你的工作与生活毫不相干,或就是你十分厌恶的,但类似的这些邮 […]

基于Lucene技术搜索引擎设计与实现 01月16日

【摘要】基于Web的统一发布平台是一种新型的管理方式,汇集了方便、快捷、有效等优势。其充分利用了信息技术,提高管理效率,降低了用户工作强度,提高信息传递速度、效率和准确性。统一发布平台要实现的功能非常多,本文所要研究和实现的搜索引擎就是其重要组成部分之一。互联网的快速,蓬勃发展的今天,它有着不同的网络的信息。在享受互联网带来的便利同时,面临着如何准确,快速,方便地找到他们需要在这样一个大规模的环境 […]

基于Lucene的中文分词技术研究与实现 11月22日

【摘要】信息技术的快速发展推动了互联网的信息的不断丰富和搜索引擎技术的加速发展,作为信息检索之一的中文分词技术显得尤为重要,中文分词技术促进了全文检索技术的发展。Lucene便是随着这一过程而产生发展的。Lucene是由apache公司开发的一个开源工具包,其目的是为了实现全文检索。但在具体的实现上,它仍有很多改进的地方,尤其是在对中文信息的处理上。所以本文的研究重点是Lucene的中文分词技术。 […]