Hadoop の 3 つのコア コンポーネントは、Hadoop 分散ファイル システム (HDFS)、MapReduce、および Yet Another Resource Negotiator (YARN) です。
-
Hadoop 分散ファイル システム (HDFS):
- HDFS は、大規模なデータ セットを保存するために使用される Hadoop の分散ファイル システムです。大きなファイルを複数のデータ ブロックに分割し、これらのデータ ブロックをクラスター内の複数のノードに分散して保存します。 HDFS は、大容量、高信頼性、高スループットのデータ ストレージ ソリューションを提供し、Hadoop 分散コンピューティング フレームワークの基盤です。
-
MapReduce:
- MapReduce は、大規模なデータ セットを並列処理するための Hadoop の分散コンピューティング フレームワークです。これは関数型プログラミング モデルに基づいており、コンピューティング タスクを Map と Reduce の 2 つの段階に分解します。 Map ステージは入力データを処理する独立したタスクに分割し、Reduce ステージは Map タスクの結果を最終出力に結合します。 MapReduce は、フォールト トレランス、スケーラビリティ、および並列処理機能を提供します。
-
Yet Another Resource Negotiator (YARN):
- YARN は、Hadoop のリソース マネージャーであり、リソースのスケジューリングと管理を担当します。集まる。複数のアプリケーションにコンピューティング リソースを割り当てて管理できるため、コンピューティング リソースの使用率が向上します。 YARN は、クラスター内のコンピューティング リソースを複数のコンテナーに分割し、各アプリケーションの実行状態を監視および管理しながら、さまざまなアプリケーションに適切なリソースを提供します。
これら 3 つのコンポーネントは合わせて Hadoop 分散コンピューティング フレームワークの中核を形成し、Hadoop をオフライン データ分析に優れたものにします。クラウド コンピューティングでは、Hadoop をビッグ データおよび仮想化テクノロジと組み合わせて、データ処理を強力にサポートします。
以上がHadoop の 3 つのコア コンポーネントの紹介の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。