Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(DistributedFileSystem),其中一个组件是HDFS(HadoopDistributedFileSystem)。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(highthroughput)来访问应用程序的数据,适合那些有着超大数据集(largedataset)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streamingaccess)文件系统中的数据。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算[1]。
hadoop 0.18.0安装数据连接源代码...
👤 ippler8
⬇️ 160 次下载
单机伪分布spark-hadoop配置教程...
⬇️ 5 次下载
随着科技技术的发展,数据呈现几何级的增长,面对这个情况传统存储服务无法满足复杂数据慢慢地暴露出来,传统的存储计算服务不仅浪费着极大的资源,还对于环境有着极大的不利影响。在这个大环境下云计算应势而生。本论文将针对目前的存储服务无法满足复杂数据的问题,研究云存储中的任务调度技术。通过与Hadoop平台结...
👤 阿四AIR
⬇️ 42 次下载
用Linux和Apache Hadoop进行云计算使用Linux 和 Hadoop 进行分布式计算介绍Hadoop 框架.
...
👤 tiantwo
⬇️ 76 次下载
HADOOP 0.18.0安装源代码头文件...
👤 siguazgb
⬇️ 78 次下载