首页

基于云计算棉花仓储海量数据挖掘算法研究 05月25日

【摘要】如今数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB).EB(1024PB-1EB)乃至ZB(1024EB=1ZB)级别。爆炸式的数据增长给传统服务器集群性能带来严峻的挑战,传统数据挖掘算法已经无法高效的从数据海洋中挖掘出知识。云计算使计算分布在大量的计算机上,该计算模式非常适合处理大数据,能够有效地解决传统计算模式的性能瓶颈。Hadoop是一个开放源代码的分布 […]