ホームページ >運用・保守 >Linuxの運用と保守 >Linux に Hadoop をインストールする方法

Linux に Hadoop をインストールする方法

WBOY
WBOY転載
2023-05-18 20:19:134488ブラウズ

1: JDK のインストール

1. 次のコマンドを実行して、JDK1.8 インストール パッケージをダウンロードします。

wget --no-check-certificate https://repo.huaweicloud.com/java/jdk/8u151-b12/jdk-8u151-linux-x64.tar.gz

2. 以下のコマンドを実行して、ダウンロードした JDK1.8 インストールパッケージを解凍します。

tar -zxvf jdk-8u151-linux-x64.tar.gz

3. JDK パッケージを移動し、名前を変更します。

mv jdk1.8.0_151/ /usr/java8

4. Java 環境変数を設定します。

echo 'export JAVA_HOME=/usr/java8' >> /etc/profile
echo 'export PATH=$PATH:$JAVA_HOME/bin' >> /etc/profile
source /etc/profile

5. Java が正常にインストールされているかどうかを確認します。

java -version

2: Hadoop のインストール

注: Hadoop インストール パッケージをダウンロードするには、Huawei ソースを選択できます (速度は中程度で許容範囲内、フル バージョンに重点が置かれています)。 、清華大学のソース (3.0.0 以降。バージョンのダウンロード速度が遅すぎてバージョンが少ない)、北京外国語大学のソース (ダウンロード速度は非常に速いですが、バージョンが少ない) - 私は個人的にテストしました

1. 次のコマンドを実行して、Hadoop インストール バッグをダウンロードします。

wget --no-check-certificate https://repo.huaweicloud.com/apache/hadoop/common/hadoop-3.1.3/hadoop-3.1.3.tar.gz

2. 次のコマンドを実行して、Hadoop インストール パッケージを /opt/hadoop に解凍します。

tar -zxvf hadoop-3.1.3.tar.gz -C /opt/
mv /opt/hadoop-3.1.3 /opt/hadoop

3. 次のコマンドを実行して、Hadoop 環境変数を設定します。

echo 'export HADOOP_HOME=/opt/hadoop/' >> /etc/profile
echo 'export PATH=$PATH:$HADOOP_HOME/bin' >> /etc/profile
echo 'export PATH=$PATH:$HADOOP_HOME/sbin' >> /etc/profile
source /etc/profile

4. 次のコマンドを実行して、設定ファイルyarn-env.shおよびhadoop-env.shを変更します。

echo "export JAVA_HOME=/usr/java8" >> /opt/hadoop/etc/hadoop/yarn-env.sh
echo "export JAVA_HOME=/usr/java8" >> /opt/hadoop/etc/hadoop/hadoop-env.sh

5. 次のコマンドを実行して、Hadoop が正常にインストールされているかどうかをテストします。

hadoop version

バージョン情報が返されれば、インストールは成功です。

3: Hadoop の構成

1. Hadoop 構成ファイル core-site.xml を変更します。

a. 次のコマンドを実行して編集ページに入ります。

vim /opt/hadoop/etc/hadoop/core-site.xml

b. i と入力して編集モードに入ります。 c. 次のコンテンツを <configuration></configuration> ノードに挿入します。

 <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/opt/hadoop/tmp</value>
        <description>location to store temporary files</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>

d. Esc キーを押して編集モードを終了し、「wq」と入力して保存して終了します。

2. Hadoop 構成ファイル hdfs-site.xml を変更します。

a. 次のコマンドを実行して編集ページに入ります。

vim /opt/hadoop/etc/hadoop/hdfs-site.xml

b. i と入力して編集モードに入ります。 c. 次のコンテンツを <configuration></configuration> ノードに挿入します。

 <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/opt/hadoop/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/opt/hadoop/tmp/dfs/data</value>
    </property>

d. Esc キーを押して編集モードを終了し、「wq」と入力して保存して終了します。

4: SSH パスワードなしログインの設定

1. 次のコマンドを実行して、公開キーと秘密キーを作成します。

ssh-keygen -t rsa

2. 次のコマンドを実行して、authorized_keys ファイルに公開キーを追加します。

cd ~
cd .ssh
cat id_rsa.pub >> authorized_keys

エラーが報告された場合は、次の操作を実行してから、上記の 2 つのコマンドを再実行します。エラーが報告されない場合は、直接手順 5 に進みます。 #環境変数に次のコマンドを入力します。 次の構成を追加します。

vi /etc/profile
次に、次の内容をそれに追加します。

export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root
次のコマンドを入力します。変更を有効にするには、

source /etc/profile
5: Hadoop を開始します

1.

次のコマンドを実行して、namenode を初期化します。
hadoop namenode -format
2.

以下のコマンドを順番に実行してHadoopを起動します。
start-dfs.sh
Y/N が選択されている場合は Y を選択し、それ以外の場合は Enter を直接押してください
start-yarn.sh

3.

起動に成功したら、次のコマンドを実行します。 、正常に開始されたプロセスを表示します。
jps

通常は 6 つのプロセスがあります;Linux に Hadoop をインストールする方法


4.

ブラウザを開いて、 http://:8088 および http://:50070 にアクセスし、以下のインターフェイスが表示されれば、Hadoop 擬似分散環境が完成しています。

Linux に Hadoop をインストールする方法#

以上がLinux に Hadoop をインストールする方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はyisu.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。