首页

MapReduce作业调度算法优化与改进研究 05月25日

【摘要】随着互联网技术的迅猛发展,IT产业已经逐渐趋于消费化、社会化,日益累积的大数据已经开辟了一个崭新的计算时代,而云计算为这个时代带来了无限机遇与挑战。在Google云计算三大论文和Apache开源社区的推动下,Hadoop逐渐发展为应用最广泛的开源云计算平台。作为其中的核心技术之一,MapReduce作业处理框架及其作业调度算法对整个系统的性能起着至关重要的作用,而数据本地性是衡量作业调度算 […]

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

基于Hadoop的网络文本分析技术研究与实现 08月25日

【摘要】由于移动设备和互联网网络的快速发展,互联网上产生的信息呈指数级的增长。处理海量数据的两个关键问题就是海量数据的存储和计算问题,传统的文本处理系统在这两个方面都不能满足海量网络文本分析的需求。如何高效的实时获取网络信息,实现海量文本数据的存储和计算是目前学术界和工业界共同关注的问题,因此对一问题的研究具有重要的意义。面对海量数据的存储与计算问题,云计算和大数据处理技术从概念的提出到投入应用, […]

基于Hadoop的学习资源分布模型设计研究 07月21日

【摘要】随着计算机技术、网络应用和多媒体技术的不断发展,学习者的学习观念和学习形式也在不断的发生转变。在这种转变下网络学习满足了学习者的终身学习和开放式学习的需要,成为学习者学习的一个重要途径和方式。在这种形式下,网络学习资源的组织和提供成了整个学习过程中的核心部分。为了满足学习者的需求,各个单位也分别开发了自己的资源库。但是,随着各个学科不断的发展,学习内容不断的丰富,学习资源形式的不断更新,对 […]

K-means算法与智能算法融合的研究 02月19日

【摘要】数据挖掘的基本含义就是从海量、不完全、有噪音的数据中获取对用户来说有直接或间接价值的信息。聚类分析的显著特征就是不需要任何先验知识或信息,只是根据事物之间的某些属性,把事物聚集成类,同时要尽可能满足同一个簇内和簇间的高内聚、低耦合要求,聚类是一种无导师监督的学习方法,聚类分析技术的迅速发展使得它被广泛地应用于科研和生活中的各个方面,是数据挖掘领域重要的分支之一。K-means算法是典型的一 […]

基于云服务的智能家居系统的研究与设计 09月26日

【摘要】随着智能家居技术的发展和产品的普及,当前人们所需求的智能化和舒适性却远远不够,主要问题表现在:安装操作复杂、数据瓶颈多、资源利用率低并且实时性差。本文通过研究基于云服务的智能家居体系架构,利用云计算的高可用性、多服务性和低成本等优势,给出了一种远程控制的智能家居方案,达到以最少的资源、最低的成本提供最多的服务的目的。论文首先对智能家居系统和云计算等相关技术进行了深入的研究,通过对智能家居发 […]

结合ELM和非负矩阵分解的数据表示方法的研究与应用 05月08日

【摘要】随着信息技术的快速发展,海量高维数据不断涌现,高维数据明显增加了计算,存储的代价,给机器学习,模式识别等提出严峻的挑战,如数据灾难。数据降维能有效地避免维数灾难,已经成为图像检索,模式识别,机器学习等领域的热点问题。其中非负矩阵分解(Non-negativeMatrixFactorization,NMF),是一种强大的数据降维工具,已经在机器学习(如分类,聚类问题)领域得到广泛使用。面对高 […]

基于微博信息分析对旅游景点热度预测系统的设计与实现 10月30日

【摘要】微博作为目前最流行的社会化网络媒体,其对旅游景点热度预测方面有一定的作用和意义,不仅可以帮助用户在选择游玩景点时提供决策参考的价值,还可以帮助商家给用户提供个性化的旅游景点推荐,甚至在预防突发事件的发生上也有一定的重要作用。要想实现旅游景点热度预测系统,需要解决如下一些问题:一是,微博数据库的数据量正在爆炸式的增长,其数据量之大,已经超出了传统的技术对数据的处理能力。二是,传统的关键词提取 […]

基于Hadoop平台的重叠社区发现算法研究 10月31日

【摘要】网络已经成为研究关联对象系统的重要方法,在比如生物信息学和人类社区等多种研究领域都有重要应用。社区发现是研究网络结构的一个关键方法,相互间关联的节点集合组成了网络中有意义的子集,例如蛋白质复合体或者社交圈。真实网络中的社区往往是重叠的,也就是说网络中存在同时属于几个社区的节点,这样的节点称之为重叠节点。传统的社区发现算法是将社区定义为了节点的集合,而节点的全局层次结构无法捕捉到网络的重叠关 […]

基于Hadoop的时态信息存储与检索策略的研究 10月03日

【摘要】随着信息技术的深入发展,蜂拥而至的信息演变成了各个领域和行业分析、处理以及应用的关键,成为左右决策最重要的因素。几乎所有信息都显式或隐式地具备时态特征,探讨时态信息的存储与检索技术成为是时态信息处理的核心之一。当前架构在传统关系数据库之上的时态数据模型在进行超大规模和高并发的时态数据存储和处理时遭遇了性能瓶颈,暴露了诸多难以克服的问题,既无法满足对时态数据的高并发读写需求,同时也难以处理大 […]

基于Hadoop的云安全存储系统的设计与实现 10月03日

【摘要】云计算是分布式计算、并行计算和网格计算的发展,给人类生活、生产方式和商业模式带来根本性改变,是当前全社会关注的热点之一。云存储是从云计算概念上延伸发展出来的一个新的概念,它是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。随着云计算技术与云存储技术的广泛应用,其存在的安全问题不断突 […]