Home >Database >Mysql Tutorial >RHadoop概况

RHadoop概况

WBOY
WBOYOriginal
2016-06-07 16:33:531333browse

认识Rhadoop——了解概况 RHadoop是运行R语言的Hadoop分布式计算平台的简称。要认识Rhadoop首先我们分别来认识R语言和Hadoop。Hadoop已经成名好多年了,它是Apache软件基金会旗下的一个JAVA开源分布式计算平台,现已被各大互联网企业(包括Yahoo和Facebook等

认识Rhadoop——了解概况 RHadoop是运行R语言的Hadoop分布式计算平台的简称。要认识Rhadoop首先我们分别来认识R语言和Hadoop。 Hadoop已经成名好多年了,它是Apache软件基金会旗下的一个JAVA开源分布式计算平台,现已被各大互联网企业(包括Yahoo和Facebook等)用于大规模数据分布式存储与分布式计算。近年来随着云计算、大数据处理、数据挖掘等概念和应用越来越火,Hadoop更是名声大噪,各大企业对熟悉Hadoop体系架构和性能优化的人才需求也相当旺盛,人才缺口也相对加大。 R语言可能对大多数人来说比较陌生,但是做数理统计、数据分析的人不会不知道R。R是一门主要运用于统计分析与绘图的编程语言和操作工具。和Matlab类似,R是一门高级脚本化编程语言,直接在命令行输入指令即可运行,无需编译链接。它可以进行高效的向量化运算,效率远高于传统的循环运算。另外,R是开源的,有大批杰出的工程师和程序员为R开发了许多好用的函数库和图形化工具,尤其在数理统计方面有大量成熟的开源的程序包。所以R是做数据挖掘、数据分析的廉价高效的方案。 所以如果让能R运行在Hadoop平台上可以说是如虎添翼,可以让数据分析人员,即能用到R丰富的程序包,又能借助Hadoop分布式运算、分布式存储的优势做海量数据的处理。 现在,这个如果已经可以成为结果。 后期操作: Rhadoop——安装并运行 安装配置这样的集群服务器就像搭积木,须要一步一步按部就班,可能会有些繁琐,但是在安装之前如果先理清一下思路,并且了解一下Hadoop的一些基本概念,会让安装过程显得更仅仅有条。 安装过程我们分两大步来做: 1、安装Java环境、R环境、ssh等各种必需品; 2、安装并配置Hadoop和Rhadoop程序包。 如果各种“必需品”恰好已经在服务器上安装过下文所述的相应版本,那么就可以直接进行第二步了。
Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn