Hadoop は、Apache Foundation によって開発された分散システム インフラストラクチャであり、大量のデータの分散処理が可能なソフトウェア フレームワークです。Hadoop は、信頼性が高く、効率的で、スケーラブルな方法でデータを処理します。ユーザーは、分散プログラムを必要とせずに開発できます。配布の根本的な詳細を理解する。
#ユーザーは、Hadoop 上で大量のデータを処理するアプリケーションを簡単に開発して実行できます。
Hadoop は、HDFS と呼ばれる分散ファイル システム (Hadoop 分散ファイル システム) を実装します。 HDFS は耐障害性が高く、低コストのハードウェアに導入できるように設計されており、アプリケーション データにアクセスするための高いスループットを提供するため、大規模なデータ セットを持つユーザーに適しています。 HDFS は POSIX 要件を緩和し、ファイル システム内のデータへのストリーミング アクセスを可能にします。
Hadoop フレームワークの核となる設計は、HDFS と MapReduce です。 HDFS は大規模なデータのストレージを提供し、MapReduce は大規模なデータの計算を提供します。
Hadoop には主に次の利点があります。
● 高い信頼性。データをビットごとに保存して処理する Hadoop の機能は信頼に値します。
#● 高い拡張性。 Hadoop はデータを分散し、利用可能なコンピューター クラスター間でコンピューティング タスクを完了します。クラスターは数千のノードに簡単に拡張できます。#● 効率。 Hadoop はノード間でデータを動的に移動し、各ノードの動的バランスを確保できるため、処理速度が非常に高速です。
##● 高い耐障害性。 Hadoop は、データの複数のコピーを自動的に保存し、失敗したタスクを自動的に再配布できます。##● 低コスト。オールインワン マシン、商用データ ウェアハウス、QlikView や Yonghong Z-Suite などのデータ マートと比較して、Hadoop はオープンソースであるため、プロジェクトのソフトウェア コストが大幅に削減されます。
Hadoop には Java 言語で書かれたフレームワークが付属しているため、Linux 運用プラットフォームで実行するのが理想的です。 Hadoop 上のアプリケーションは、C などの他の言語で作成することもできます。
以上がハドゥープとは何ですかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。