BigData ビッグデータの運用・保守-Linuxの運用と保守-php.cn

ホームページ

運用・保守

Linuxの運用と保守

BigData ビッグデータの運用・保守

重铸

Jul 23, 2020 pm 05:24 PM

ビッグデータの運用と保守

1.HDFS分散ファイルシステムの運用と保守

1.in HDFS ルートディレクトリに再帰を作成しますファイルシステムディレクトリ "1daoyun/file" 、添付ファイル内の BigDataSkills.txt ファイルを 1daoyun/file ディレクトリにアップロードし、関連するコマンドを使用してファイルを表示しますシステム内 1daoyun/file ディレクトリのファイルリスト情報。 2.

HDFS

ファイルシステムのルートディレクトリに再帰ディレクトリ

"1daoyun/file"

を作成し、添付の

BigDataSkills.txt をアップロードします。ファイルへ1daoyun/ ファイルディレクトリに移動し、HDFS ファイルシステムチェックツールを使用して、ファイルが破損しているかどうかを確認します。 hadoop fs -mkdir -p /1daoyun/filehadoop fs -put BigDataSkills.txt/1daoyun/filehadoop fsck /1daoyun/file/BigDataSkills.txt 3.

HDFS

ファイルシステムのルートディレクトリに再帰ディレクトリ

「1daoyun/file」

を作成し、添付されている

BigDataSkills.txtをアップロードします

ファイルを 1daoyun /ファイルディレクトリ。アップロードプロセスでは、HDFS ファイルシステム内の bigdataskills.txt ファイルを指定して、係数を 2 としてコピーします。ブロックのコピー数。

hadoop fs -mkdir -p /1daoyun/file

hadoop fs -D dfs.replication=2 -put BigDataSkills.txt /1daoyun/file

hadoop fsck /1daoyun/file/BigDataSkills.txt

4.HDFS ファイルシステムのルートディレクトリに /apps というファイルディレクトリがあり、このディレクトリのスナップショット作成機能を有効にし、スナップショットを作成する必要があります。スナップショットファイルの名前は apps_1daoyun です。関連コマンドを使用してスナップショットファイルのリスト情報を表示するには、を使用します。

hadoop dfsadmin -allowSnapshot /apps

hadoop fs -createSnapshot /apps apps_1daoyun

hadoop fs -ls /apps/.snapshot

5. ダン Hadoop クラスターが起動すると、まずセーフモードに入ります。デフォルトでは、このモードは 30 秒後に終了します。システムがセーフモードの場合、HDFS ファイルシステムは読み取りのみが可能で、は書き込み、変更、削除などの操作を実行できません。ここで、Hadoop クラスターを保守する必要があるとします。クラスターをセーフモードにして、そのステータスを確認する必要があります。

hdfs dfsadmin -safemode enter

hdfs dfsadmin -safemode get

6. オペレーターが誤ってファイルを削除するのを防ぐために、HDFS ファイルシステムは機能を提供しますゴミ箱の容量を減らしますが、ジャンクファイルが多すぎると多くのストレージスペースを占有します。 XiandianビッグデータプラットフォームのWEBインターフェースは、HDFSファイルシステムのごみ箱内のファイルを7日以内に完全に削除する必要があります。高度なコアサイトfs.trash.interval: 10080

7.オペレーターが誤ってファイルを削除することを防ぐために、HDFSファイルシステムはごみ箱機能を提供しますが、ジャンクファイルが多すぎると多くのストレージスペースを占有します。 Linux Shellの「vi」コマンドを使用して、対応する設定ファイルとパラメータ情報を変更し、ごみ箱機能をオフにする必要があります。完了したら、対応するサービスを再起動します。高度なcore-sitefs.trash.interval: 0vi /etc/hadoop/2.4.3.0-227/0/core-site.xml

sbin/stop-dfs.sh

sbin/start-dfs.sh8.Hadoop

クラスター内のホストでダウンタイムが発生したり、

これらの問題が発生すると、

HDFS ファイルの信頼性を確保するために、必然的にデータファイルが破損するか失われます。システムでは、高度なビッグデータプラットフォーム

WEB インターフェイスを使用する必要があります。

クラスターの冗長レプリケーション係数を 5 に変更します。一般レプリケーションのブロック5

9.Hadoop でこれらの問題が発生すると、場合によっては、HDFS ファイルシステム内のデータファイルが破損したり、損傷したりすることがあります。損失が発生しました。HDFS ファイルシステムの信頼性を確保するには、クラスターの冗長性レプリケーション係数を5、Linux Shell で使用されるに変更する必要があります。」 vi"コマンドを使用して、対応する設定ファイルとパラメータ情報を変更します。完了後、対応するサービスを再起動します。

または BigData ビッグデータの運用・保守 vi/etc/hadoop/2.4.3.0-227/0/hdfs-site.xml

dfs.replication

/hadoop-client/sbin/ .sh --config /usr/hdp/current/hadoop-client/conf stop {namenode/datenode}

/usr/ hdp/current/hadoop-client/sbin/hadoop-daemon.sh -- config /usr/hdp/current/hadoop-client/conf start {namenode/datenode}

10.

コマンドを使用して、

/tmp

ディレクトリ内の

hdfs

ファイルシステム内のディレクトリの数、ファイルの数、およびファイルの合計サイズ

。

hadoop fs -count /tmp2.MapREDUCE ケースの質問

1.クラスターノード/usr/hdp/2.4.3.0-227/hadoop-mapreduce/ディレクトリには、JARパッケージhadoop-がありますマップリデュース-examples.jar。 JAR パッケージ内の PI プログラムを実行して piπ の近似値を計算するには、 Map タスクをごとに 5 回実行する必要があります地図タスクのスロー数は5です。

/usr/hdp/2.4.3.0-227/hadoop-mapreduce/

hadoop jar hadoop-mapreduce-examples-2.7.1.2.4.3.0-227.jar pi 5 5

BigData ビッグデータの運用・保守

クラスターノード /usr/hdp/2.4.3.0-227/hadoop-mapreduce/ ディレクトリには、ケース JAR がありますバッグhadoop-mapreduce-examples.jar。 JAR パッケージの wordcount プログラムを実行して、 /1daoyun/file/BigDataSkills.txt ファイルに対して単語カウントを実行し、操作結果を /1daoyun/output に出力します。 Directory では、関連コマンドを使用して単語数の結果をクエリします。 hadoop jar/usr/hdp/2.4.3.0-227/hadoop-mapreduce/hadoop-mapreduce-examples-2.7.1.2.4.3.0-227.jar wordcount /1daoyun/file/BigDataSkills.txt /1daoyun/出力

3.クラスターノード/usr/hdp/2.4.3.0-227/hadoop-mapreduce/ディレクトリには、ケースJARパッケージがありますhadoop-マップリデュース-examples.jar。 JAR パッケージ内の sudoku プログラムを実行して、以下の表の Sudoku 問題の結果を計算します。。

BigData ビッグデータの運用・保守

catパズル1.dta

hadoop jarhadoop-mapreduce-examples-2.7.1.2.4.3.0-227.jar sudoku /root/puzzle1.dta

4 .クラスターノード/usr/hdp/2.4.3.0-227/hadoop-mapreduce/ディレクトリには、ケースがありますjarパッケージhadoop-mapreduce-examples.jar 。 JAR パッケージ内の grep プログラムを実行して、「Hadoop」がファイルシステム /1daoyun/file/BigDataSkills.txt に出現する回数をカウントします。ファイル。統計が完了しました。完了後、統計結果情報をクエリします。 hadoop jarhadoop-mapreduce-examples-2.7.1.2.4.3.0-227.jar grep /1daoyun/file/BigDataSkills.txt /output hadoop

以上がBigData ビッグデータの運用・保守の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

DebianがHadoopデータ処理速度を改善する方法Apr 13, 2025 am 11:54 AM

この記事では、DebianシステムのHadoopデータ処理効率を改善する方法について説明します。最適化戦略では、ハードウェアのアップグレード、オペレーティングシステムパラメーターの調整、Hadoop構成の変更、および効率的なアルゴリズムとツールの使用をカバーしています。 1.ハードウェアリソースの強化により、すべてのノードが一貫したハードウェア構成、特にCPU、メモリ、ネットワーク機器のパフォーマンスに注意を払うことが保証されます。高性能ハードウェアコンポーネントを選択することは、全体的な処理速度を改善するために不可欠です。 2。オペレーティングシステムチューニングファイル記述子とネットワーク接続：/etc/security/limits.confファイルを変更して、システムによって同時に開くことができるファイル記述子とネットワーク接続の上限を増やします。 JVMパラメーター調整：Hadoop-env.shファイルで調整します

Debian syslogを学ぶ方法Apr 13, 2025 am 11:51 AM

このガイドでは、Debian SystemsでSyslogの使用方法を学ぶように導きます。 Syslogは、ロギングシステムとアプリケーションログメッセージのLinuxシステムの重要なサービスです。管理者がシステムアクティビティを監視および分析して、問題を迅速に特定および解決するのに役立ちます。 1. syslogの基本的な知識Syslogのコア関数には以下が含まれます。複数のログ出力形式とターゲットの場所（ファイルやネットワークなど）をサポートします。リアルタイムのログ表示およびフィルタリング機能を提供します。 2。syslog（rsyslogを使用）をインストールして構成するDebianシステムは、デフォルトでrsyslogを使用します。次のコマンドでインストールできます：sudoaptupdatesud

DebianでHadoopバージョンを選択する方法Apr 13, 2025 am 11:48 AM

Debianシステムに適したHadoopバージョンを選択する場合、次の重要な要因を考慮する必要があります。1。安定性と長期的なサポート：安定性とセキュリティを追求するユーザーにとって、Debian11（Bullseye）などのDebianの安定したバージョンを選択することをお勧めします。このバージョンは完全にテストされており、最大5年のサポートサイクルがあり、システムの安定した動作を確保できます。 2。パッケージの更新速度：最新のHadoop機能と機能を使用する必要がある場合は、DebianのUnstableバージョン（SID）を検討できます。ただし、不安定なバージョンには互換性の問題と安定性のリスクがあることに注意する必要があります。 3。コミュニティのサポートとリソース：Debianには、豊富なドキュメントを提供できるコミュニティサポートが大きくなり、

debianのtigervnc共有ファイルメソッドApr 13, 2025 am 11:45 AM

この記事では、Tigervncを使用してDebian Systemsでファイルを共有する方法について説明します。最初にtigervncサーバーをインストールしてから構成する必要があります。 1. TigerVNCサーバーをインストールし、端末を開きます。ソフトウェアパッケージリストの更新リスト：sudoaptupdate tigervnc server：sudoaptinstaltaltigervnc-standalone-servertigervnc-common2。tigervncサーバーを構成するVNCサーバーパスワードを設定します。

Debian Mail Serverファイアウォールの構成のヒントApr 13, 2025 am 11:42 AM

Debian Mail Serverのファイアウォールの構成は、サーバーのセキュリティを確保するための重要なステップです。以下は、iPtablesやFirewalldの使用を含む、一般的に使用されるファイアウォール構成方法です。 iPtablesを使用してファイアウォールを構成してIPTablesをインストールします（まだインストールされていない場合）：sudoapt-getupdatesudoapt-getinstalliptablesview現在のiptablesルール：sudoiptables-l configuration

Debian Mail Server SSL証明書のインストール方法Apr 13, 2025 am 11:39 AM

Debian Mail ServerにSSL証明書をインストールする手順は次のとおりです。1。最初にOpenSSL Toolkitをインストールすると、OpenSSLツールキットがシステムに既にインストールされていることを確認してください。インストールされていない場合は、次のコマンドを使用してインストールできます。sudoapt-getUpdatesudoapt-getInstalopenssl2。秘密キーと証明書のリクエストを生成次に、OpenSSLを使用して2048ビットRSA秘密キーと証明書リクエスト（CSR）を生成します：Openss

Debian Mail Server仮想ホスト構成方法Apr 13, 2025 am 11:36 AM

Debianシステムでのメールサーバーの仮想ホストの構成には、通常、Apache Httpserverではなく、Apache Httpserverではなく、Mail Serverソフトウェア（Postfix、Eximなど）のインストールと構成が含まれます。以下は、メールサーバーの構成のための基本的な手順です仮想ホスト：ポストフィックスメールサーバー更新システムパッケージ：sudoaptupdatesudoaptupgradeポストフィックス：sudoapt

Debian Mail Server DNSセットアップガイドApr 13, 2025 am 11:33 AM

Debian Mail ServerのDNS設定を構成するには、次の手順に従うことができます。ネットワーク構成ファイルを開きます。テキストエディター（VIやNANOなど）を使用して、ネットワーク構成ファイル/など/ネットワーク/インターフェイスを開きます。 sudonano/etc/network/interfacesネットワークインターフェイス構成を検索：構成ファイルで変更するネットワークインターフェイスを見つけます。通常、イーサネットインターフェイスの構成はIFETH0ブロックにあります。

See all articles