搭建yarn(hadoop-2.2.0)环境详细过程-Mysql Tutorial-php.cn

Home

Database

Mysql Tutorial

搭建yarn(hadoop-2.2.0)环境详细过程

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 04:37 PM

yarnbuildenvironmentdetailedprocess

磨刀不误砍柴工，在这里我们先了解一个问题： MapReduce和YARN是什么关系？答：YARN并不是下一代MapReduce（MRv2），下一代MapReduce与第一代MapReduce（MRv1）在编程接口、数据处理引擎（MapTask和ReduceTask）是完全一样的，可认为MRv2重用了MRv1的这些

磨刀不误砍柴工，在这里我们先了解一个问题：

MapReduce和YARN是什么关系？

答：YARN并不是下一代MapReduce（MRv2），下一代MapReduce与第一代MapReduce（MRv1）在编程接口、数据处理引擎（MapTask和ReduceTask）是完全一样的，可认为MRv2重用了MRv1的这些模块，不同的是资源管理和作业管理系统，MRv1中资源管理和作业管理均是由JobTracker实现的，集两个功能于一身，而在MRv2中，将这两部分分开了，其中，作业管理由ApplicationMaster实现，而资源管理由新增系统YARN完成，由于YARN具有通用性，因此YARN也可以作为其他计算框架的资源管理系统，不仅限于MapReduce，也是其他计算框架，比如Spark、Storm等，通常而言，我们一般将运行在YARN上的计算框架称为“X on YARN”，比如“MapReduce On YARN”, "Spark On YARN"，“Storm On YARN”等。

Hadoop 2.0由三个子系统组成，分别是HDFS、YARN和MapReduce，其中，YARN是一个崭新的资源管理系统，而MapReduce则只是运行在 YARN上的一个应用，如果把YARN看成一个云操作系统，那么MapReduce可认为是运行在这个操作系统上的App。

2014/7/22 23:41:22

（接）上次写到MapReduce和YARN是什么关系？今天就要正式搭建环境。

搭建环境准备：具体参照《搭建Hadoop-0.20.2环境》一文中的第一步到第六步

系统：Ubuntu-12.04（其他版本也可以）

模式：伪分布式

搭建用户：hadoop

Hadoop-2.2.0下载地址：http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.2.0/
选择你需要的安装包，在这里我们选择hadoop-2.2.0.tar.gz
附Hadoop镜像链接地址：http://www.apache.org/dyn/closer.cgi/hadoop/common/

声明1：我配置hadoop-2.2.0的目录是/home/hadoop
声明2：在/home/hadoop下创建了yarn目录hadoop-2.2.0目录和hadoop数据目录都是在yarn目录下。
声明3：在下面的搭建过程中可将/home/hadoop换成你自己的目录。

步骤一：上传hadoop-2.2.0.tar.gz 并解压到/home/hadoop/yarn目录，此时在yarn目录中解压出hadoop-2.2.0目录

<code>sudo chown -R hadoop:hadoop hadoop-2.2.0
</code>

创建Hadoop数据目录：

<code>mkdir -p /home/hadoop/yarn/yarn_data/hdfs/namenode
mkdir -p /home/hadoop/yarn/yarn_data/hdfs/datanode
</code>

配置文件之前先大体介绍一下hadoop-2.2.0目录中的各个文件夹，注意区分与Hadoop1中的改变。

外层的启动脚本在sbin目录

内层的被调用脚本在bin目录

Native的so文件都在lib/native目录

配置程序文件都放置在libexec

配置文件都在etc目录，对应以前版本的conf目录

所有的jar包都在share/hadoop目录下面

步骤二：配置环境变量

在这里我自己没有将环境全局化所以在hadoop-2.2.0中没有配置系统环境/etc/profile
如果配置，执行执行source /etc/profile，使之生效。

步骤三：core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml配置

接下来我们的具体配置就是/home/hadoop/yarn/hadoop-2.2.0/etc/hadoop目录中进行。

core-site.xml配置

<code><configuration>
    <property>
        <name>fs.default.name</name>
        <value>hdfs://localhost:9000</value>
        <description>指定NameNode的IP地址和端口号</description>
    </property>
</configuration>
</code>

hdfs-site.xml

<code><configuration>
    <property>
        <name>dfs.replication</name>
        <value>2</value>
        <description>备份数</description>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/home/hadoop/yarn/yarn_data/hdfs/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/home/hadoop/yarn/yarn_data/hdfs/datanode</value>
    </property>
</configuration>
</code>

mapred-site.xml

<code><configuration>
    <property> 
        <name>mapreduce.framework.name</name> 
        <value>yarn</value> 
    </property>
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>localhost:10020</value>
    </property>
    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>localhost:19888</value>
    </property>
</configuration>        
</code>

yarn-site.xml

<code><configuration>
<!-- Site specific YARN configuration properties -->
<property>
　　<name>yarn.resourcemanager.address</name>
　　<value>localhost:8032</value>
</property>
<property>
　　<name>yarn.resourcemanager.scheduler.address</name>
　　<value>localhost:8030</value>
</property>
<property>
　　<name>yarn.resourcemanager.resource-tracker.address</name>
　　<value>localhost:8031</value>
</property>   
<property>
　　<name>yarn.resourcemanager.admin.address</name>
　　<value>localhost:8033</value>
</property>   
<property>
　　<name>yarn.resourcemanager.webapp.address</name>
　　<value>localhost:8088</value>
</property>  
<property> 
<name>yarn.nodemanager.aux-services</name> 
<value>mapreduce_shuffle</value> 
</property>   
<property> 
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> 
<value>org.apache.hadoop.mapred.ShuffleHandler</value> 
</property> 
</configuration>
</code>

步骤四：slaves配置

因为是伪分布式，所以我们只有localhost

步骤五：将配置好的hadoop-2.2.0分发同步到各个数据节点

因为是伪分布式，这步跳过。

步骤六：格式化NameNode

执行命令：

<code>bin/hdfs namenode –format
</code>

或者

<code>bin/hadoop namenode –format
</code>

步骤七：启动hdfs和yarn

启动hdfs:

<code>sbin/start-dfs.sh
</code>

启动yarn:

<code>sbin/start-yarn.sh
</code>

或者可以执行

<code>sbin/start-all.sh
</code>

一起启动hdfs和yarn。

另外还要启动history服务，不然在面板中不能打开history链接。

<code>sbin/mr-jobhistory-daemon.sh start historyserver
</code>

下面使用jps命令查看启动进程：

<code>4504 ResourceManager
4066 DataNode
4761 NodeManager
5068 JobHistoryServer
4357 SecondaryNameNode
3833 NameNode
5127 Jps
</code>

步骤八：测试

hdfs测试：

<code>在hdfs中创建文件：bin/hadoop fs -mkdir /wordcount
向hdfs中上传文件：bin/hadoop fs /home/hadoop/file2.txt /wordcount
查看hdfs文件目录：hdfs dfs –ls /
</code>

Yarn测试：运行WordCount测试程序，

<code>bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount /wordcount /output2
</code>

具体查看结果：

<code>bin/hadoop fs -cat /output2/*
</code>

结果显示：

<code>hadoop  1
hello   2
java    4
jsp 1
</code>

到这里，hadoop-2.2.0环境搭建结束，配置文件根据具体需求，具体配置。可能有配置不当的地方，若有看到还望指正。

原文地址：搭建yarn(hadoop-2.2.0)环境详细过程, 感谢原作者分享。

Statement

The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn

JavaScript包管理器比较：Npm vs Yarn vs PnpmAug 09, 2022 pm 04:22 PM

本篇文章带大家了解一下三种JavaScript包管理器（npm、yarn、pnpm），并将这三种包管理器进行对比，聊聊npm、yarn、pnpm三者的区别和关联，希望对大家有所帮助，如有问题欢迎指出！

一文浅析JS包管理工具：yarnAug 09, 2022 pm 03:49 PM

yarn 和 npm 一样也是 JavaScript 包管理工具，下面本篇文章就来带大家了解一下yarn包管理工具，希望对大家有所帮助！

Vue框架下，如何快速搭建统计图表系统Aug 21, 2023 pm 05:48 PM

Vue框架下，如何快速搭建统计图表系统在现代网页应用中，统计图表是必不可少的组成部分。Vue.js作为一款流行的前端框架，提供了很多便捷的工具和组件，能够帮助我们快速搭建统计图表系统。本文将介绍如何利用Vue框架以及一些插件来搭建一个简单的统计图表系统。首先，我们需要准备一个Vue.js的开发环境，包括安装Vue脚手架以及一些相关的插件。在命令行中执行以下命

雾锁王国能野地搭建筑吗Mar 07, 2024 pm 08:28 PM

玩家在雾锁王国中进行游戏时可以收集不同的材料用来建造建筑，有很多玩家想知道野地搭建筑吗，雾锁王国能野地是不能搭建筑的，必须要在祭坛的范围内才可以搭建。雾锁王国能野地搭建筑吗答：不能。1、雾锁王国能野地是不能搭建筑的。2、建筑必须要在祭坛的范围内才可以搭建。3、玩家可以自行放置灵火祭坛，但一旦离开了范围，将无法进行建筑搭建。4、我们也可以直接在山上挖个洞当做我们的家，这样不用耗建筑材料。5、玩家自己搭建的建筑中，存在舒适度机制，也就是说，内饰越好，舒适度越高。6、高舒适度将为玩家带来属性加成，例如

CentOS 7下搭建web服务器的网络安全加固技巧Aug 05, 2023 pm 01:12 PM

CentOS7下搭建web服务器的网络安全加固技巧web服务器是现代互联网的重要组成部分，因此保护web服务器的安全性非常重要。通过加固网络安全，可以减少风险和避免潜在的攻击。本文将介绍在CentOS7上搭建web服务器时常用的网络安全加固技巧，并提供相应的代码示例。更新系统和软件首先，确保你的系统和软件是最新版本。可以使用以下命令更

账号矩阵怎么搭建？矩阵搭建有哪些作用？Mar 23, 2024 pm 06:46 PM

在当下信息充斥的时代，社交媒体平台已经成为人们获取和分享信息的主要途径。对于个人和企业而言，建立一个有效的账号网络以实现信息的最大传播和提升影响力，已成为亟需解决的挑战。一、账号矩阵怎么搭建？1.明确目标人群在构建账号矩阵之前，关键是明确目标受众，深入了解他们的需求、兴趣和消费习惯，这样才能制定更具针对性的内容策略。2.选择合适的平台根据目标人群的特点，选择适合的社交媒体平台进行布局。目前主流的社交媒体平台有微博、微信、抖音、快手等，每个平台都有其独特的用户群体和传播特点，需要根据实际情况进行选

CentOS搭建web服务器的日志管理与监控技巧Aug 05, 2023 am 08:33 AM

CentOS搭建web服务器的日志管理与监控技巧Web服务器是现代互联网应用的重要组成部分，而服务器的日志管理与监控是确保服务器稳定运行和故障排查的关键。本文将介绍在CentOS操作系统上如何搭建web服务器，并提供一些日志管理与监控的技巧。一、搭建Web服务器安装ApacheApache是一个流行的开源Web服务器软件。在CentOS上安装Apache很简

CentOS 7下搭建web服务器的最佳实践及注意事项Aug 25, 2023 pm 11:33 PM

CentOS7下搭建web服务器的最佳实践及注意事项引言：在当今互联网时代，web服务器是构建和托管网站的核心组件之一。CentOS7是一个强大的Linux发行版，广泛应用于服务器环境。本文将探讨在CentOS7上搭建web服务器的最佳实践和注意事项，并提供一些代码示例以帮助您更好地理解。一、安装ApacheHTTP服务器Apache是使用最广泛的w

See all articles

Hot AI Tools

Undresser.AI Undress

AI-powered app for creating realistic nude photos

AI Clothes Remover

Online AI tool for removing clothes from photos.

Undress AI Tool

Undress images for free

Clothoff.io

AI clothes remover

AI Hentai Generator

Generate AI Hentai for free.

Hot Article

R.E.P.O. Energy Crystals Explained and What They Do (Yellow Crystal)

2 weeks agoBy尊渡假赌尊渡假赌尊渡假赌

How Long Does It Take To Beat Split Fiction?

1 months agoByDDD

R.E.P.O. Save File Location: Where Is It & How to Protect It?

1 months agoByDDD

R.E.P.O. Best Graphic Settings

2 weeks agoBy尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Seashell Riddle Solution

1 weeks agoByDDD

Hot Tools

DVWA

Damn Vulnerable Web App (DVWA) is a PHP/MySQL web application that is very vulnerable. Its main goals are to be an aid for security professionals to test their skills and tools in a legal environment, to help web developers better understand the process of securing web applications, and to help teachers/students teach/learn in a classroom environment Web application security. The goal of DVWA is to practice some of the most common web vulnerabilities through a simple and straightforward interface, with varying degrees of difficulty. Please note that this software

Atom editor mac version download

The most popular open source editor

SecLists

SecLists is the ultimate security tester's companion. It is a collection of various types of lists that are frequently used during security assessments, all in one place. SecLists helps make security testing more efficient and productive by conveniently providing all the lists a security tester might need. List types include usernames, passwords, URLs, fuzzing payloads, sensitive data patterns, web shells, and more. The tester can simply pull this repository onto a new test machine and he will have access to every type of list he needs.