小文本语料库在Hadoop平台上的存储策略研究 04月24日
【摘要】语料库是指基于不同目的收集起来的文本集合。在网络环境下收集的语料库,其包含的文本大小一般为KB级别,很少达到MB级别,故称之为小文本语料库。由于语料库中所包含的文本数据通常规模庞大,处理时计算量大,且许多操作具有并行性,因而产生了将文本处理迁移到分布式并行处理平台的趋势。近几年出现的Hadoop云平台,由于其具有良好的海量数据存储和高效计算能力,且是一个开源平台,因而被广泛应用于海量数据的 […]
糖尿病本体的构建与检索研究 05月21日
【摘要】现如今,伴随着我国经济的飞速发展,糖尿病已经从一种小众的“富贵病”,成为一种患病率极高,威胁大多数人生命健康的严重疾病。糖尿病的预防及治疗成为多数人们谈论的热点问题。伴随着科学技术的进步,在Web已经成为我们获取知识信息的重要来源的今天,想要在信息如海量般增长地Web上获得自己想要的准确信息已经十分困难了。例如,在Google上搜索“糖尿病预防”,马上就会得到48,300,000个结果,其 […]
基于语义网的陶瓷云平台服务检索 02月02日
【摘要】陶瓷是中国传统工业的代表,具有相当悠久的历史。科学技术的每一次进步,都给陶瓷业的设计、生产带来新的动力,不断促进陶瓷生产技术的发展与进步。然而,在陶瓷行业的发展历程中仍存在着诸多的问题。陶瓷云平台通过互联网作为载体,使用云计算中先进的商业模式,将从根本上改变陶瓷的行业现状。陶瓷云平台主要以面向服务为基础,为景德镇、佛山、醴陵、德化等重点产瓷区的陶瓷企业提供一个服务互助平台,补全企业产业链中 […]