ホームページ >よくある問題 >ハドゥープとは何ですか

ハドゥープとは何ですか

青灯夜游
青灯夜游オリジナル
2019-04-28 13:20:5853927ブラウズ

Hadoop は、Apache Foundation によって開発された分散システム インフラストラクチャであり、大量のデータの分散処理が可能なソフトウェア フレームワークです。Hadoop は、信頼性が高く、効率的で、スケーラブルな方法でデータを処理します。ユーザーは、分散プログラムを必要とせずに開発できます。配布の根本的な詳細を理解する。

ハドゥープとは何ですか

#ユーザーは、Hadoop 上で大量のデータを処理するアプリケーションを簡単に開発して実行できます。

Hadoop は、HDFS と呼ばれる分散ファイル システム (Hadoop 分散ファイル システム) を実装します。 HDFS は耐障害性が高く、低コストのハードウェアに導入できるように設計されており、アプリケーション データにアクセスするための高いスループットを提供するため、大規模なデータ セットを持つユーザーに適しています。 HDFS は POSIX 要件を緩和し、ファイル システム内のデータへのストリーミング アクセスを可能にします。

Hadoop フレームワークの核となる設計は、HDFS と MapReduce です。 HDFS は大規模なデータのストレージを提供し、MapReduce は大規模なデータの計算を提供します。

Hadoop には主に次の利点があります。

● 高い信頼性。データをビットごとに保存して処理する Hadoop の機能は信頼に値します。

#● 高い拡張性。 Hadoop はデータを分散し、利用可能なコンピューター クラスター間でコンピューティング タスクを完了します。クラスターは数千のノードに簡単に拡張できます。

#● 効率。 Hadoop はノード間でデータを動的に移動し、各ノードの動的バランスを確保できるため、処理速度が非常に高速です。

##● 高い耐障害性。 Hadoop は、データの複数のコピーを自動的に保存し、失敗したタスクを自動的に再配布できます。

##● 低コスト。オールインワン マシン、商用データ ウェアハウス、QlikView や Yonghong Z-Suite などのデータ マートと比較して、Hadoop はオープンソースであるため、プロジェクトのソフトウェア コストが大幅に削減されます。

Hadoop には Java 言語で書かれたフレームワークが付属しているため、Linux 運用プラットフォームで実行するのが理想的です。 Hadoop 上のアプリケーションは、C などの他の言語で作成することもできます。

以上がハドゥープとは何ですかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。