利用VMware搭建分布式Hadoop平台

Hadoop简介

Hadoop是Apache软件基金会旗下的开源分布式计算平台,为用户提供了系统底层细节透明的分布式计算基础架构。Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群当中。Hadoop的核心是分布式文件系统(Hadoop Distribute File System, HDFS)。HDFS是针对谷歌文件系统的开源实现,是面向普通硬件环境的分布式文件系统,具有较高的读写速度、很好的容错性和可伸缩性,支持大规模数据的分布式存储,其冗余数据的存储方式很好地保证了数据的安全性。

继续阅读“利用VMware搭建分布式Hadoop平台”