基于Hadoop平台的随机森林算法研究及图像分类系统实现 01月25日
【摘要】随着互联网和多媒体技术的不断发展,海量的图像资源和数据涌入互联网,它们深刻地影响着我们的日常生活,此时对于图像内容准确地理解显得尤为重要。图像分类技术融合了机器学习、人工智能等学科的先进思想和理论,旨在将原本无序分布的大批量的图像数据进行有序地归类,是解决图像理解问题的基础。随机森林算法建立在决策树模型基础之上,它是多棵决策树的组合,在分类场景中得到广泛应用。作为一种优秀的分类器模型,也为 […]
改进K-Means聚类算法在基于Hadoop平台的图像检索系统中的研究与实现 01月13日
【摘要】现代人们的生活已经进入了移动互联网时代,各种移动互联网设备的普及和广泛应用极大的方便了人们的生活学习等各个方面。与此同时,来自各行各业的大量信息正以多媒体信息的方式数字化并不断累积。其中图像作为最为基本的多媒体信息之一易于理解和使用,人们对图像检索的需求也从开始的根据文本描述来检索图像发展到根据图像内容来检索相似图像。图像检索早已成为计算机领域的一个研究热点,它可以按照检索内容划分为基于文 […]
基于Hadoop的医院数据中心系统设计与实现 06月24日
【摘要】随着国民经济的发展,医院信息化进程的不断推进,以电子病历、PACS系统等为代表的临床信息系统得到了广泛的使用。医院推进信息化过程中,数据存储问题日益凸现出来,传统分散式的数据存储模式有着明显的缺陷,数据安全性、可靠性得不到保障,数据备份繁琐,并且无法挖掘数据的潜在价值,因此数据中心建设提上医院信息化日程。鉴于以传统Unix服务器为基础的数据中心具有成本高、计算能力不足、数据读取速度相对较慢 […]
基于Hadoop的同源性搜索GO功能注释平台的研究 10月30日
【摘要】随着第二代基因测序技术的广泛使用,基因测序速度得到了很大地提升。随之产生了海量的生物数据,这些数据需要通过分析、整理和注释之后才能使其具有生物学含义。目前,已经有大量的生物信息数据库用来高效地存储和管理这些庞大的信息。利用这些已经注释过的生物学数据来对新的数据进行注释,已成为生物信息学的一个重要领域。基因本体论GO,构建了一个跨物种的注释词汇库,从而精确定义了基因的功能及功能间的关系,在注 […]
基于Hadoop的视频监控系统的设计与实现 10月10日
【摘要】随着平安中国项目的深入,公众对视频监控的需求越来越强烈。摄像头等视频采集设备的清晰度不断提高,监控器的个数不断增加,对视频处理的需求不断提高,这与传统的网络视频监控系统架构发生矛盾。而日益兴起的云计算为视频监控开辟了一条新的道路,云视频监控系统满足了大数据计算、存储的要求,解决了传统的视频监控系统的缺陷。本文的工作正是在云计算技术基础上搭建大规模高清视频监控系统。本文首先简单介绍视频监控技 […]
基于Mapreduce的大规模中文短文本聚类算法的设计与实现 07月21日
【摘要】文本聚类是数据挖掘和信息检索领域的一个重要研究方向。如何挖掘网页上的海量文本信息已经成为计算机科学领域所面临的一个巨大挑战。文本聚类技术的出现为海量文本信息的分类管理提供了一条有效的途径。近年来文本聚类在信息检索、多文本自动摘要等互联网领域获得了广泛的应用。云计算的兴起,为分布式并行计算提供了更多的框架,文本挖掘技术的分布式实现也开始被越来越多的研究人员所关注。Hadoop是Apache的 […]
农资电子商务智能推荐模型研究 02月26日
【摘要】电子商务发展至今已经成为能够和实体购物相提并论的购物模式,其涉及的领域也越来越广泛,从衣食住行到娱乐、文化等,甚至从逐渐饱和的城市转移到尚待开发的农村市场,可以说“无孔不入”,这种新的消费模式的到来为广大用户带来了极大的方便,然而它的副作用也不可忽视。以农资电子商务网站为例,农资商品信息、消费者的需求信息以及其他各种信息充斥在互联网这条信息高速路上,人们的需求和电商的供给本应该像行驶在同一 […]
基于云计算的医疗器械检测信息化平台研究 10月14日
【摘要】医疗器械行业作为一种新兴的高科技、快发展行业,涉及的技术领域广,对专业要求高,行业跨度大,因此对应的医疗器械检测机构的实验室工作也趋于综合性强、复杂度高、设备精细化的走向。医疗器械检测机构能够做出高效正确的检测数据或检测报告,不仅得益于前沿的检测设备、高水平的检测专家,还跟一流的现代化管理水平分不开。本文利用云计算的数据管理技术研究医疗器械检测信息化平台,希望借助云计算技术提升当前的信息化 […]
基于云平台的服务器监控系统设计 10月13日
【摘要】当前,随着云计算技术的快速发展,云数据中心的数量也越来越多。云数据中心中有数量众多的服务器,对服务器运行状态的监控成为云平台非常重要的组成部分。高效实时的监控可以保障云平台的稳定,提高云服务的可用性。而传统的监控系统对于当前云数据中心服务器众多的情况,很难保证监控的实时性和高效性。因此,研究实时、高效、低占用的服务器监控系统还是很有意义的。云计算相关的分布式存储技术及分布式计算技术为服务器 […]
基于Hadoop的并行实体解析方法研究与应用 07月07日
【摘要】实体解析用于判断两个数据记录是否描述的是现实世界中的同一实体对象。它对于数据集成、数据清洗、数据去重和处理优化都十分重要。实体解析所处理的对象不仅局限于数据记录,还包括在文本文件比对、文档查重、人脸图像识别、指纹识别等一些具有特定解析需求的实际应用中。从参与实体解析的主体角度来看,可以将实体解析的方法分为两大类,即基于机器算法的实体解析和基于人工的实体解析。纯粹的机器算法解析虽然可以获得较 […]