検索
ホームページよくある問題ビッグデータから何を学ぶか

ビッグデータから何を学ぶか

Apr 29, 2020 am 11:47 AM
ビッグデータ

ビッグデータから何を学ぶか

1. Java プログラミング

Java プログラミングはビッグ データ開発の基礎です。Hadoop や Spark など、ビッグ データの多くのテクノロジは Java で書かれています。 . 、mapreduce など。そのため、ビッグデータをしっかり学びたいなら、Java プログラミングは必須のスキルです。

(推奨学習: java 入門プログラム )

2. Linux の運用とメンテナンス

エンタープライズ ビッグ データ開発は、多くの場合、 Linuxオペレーティングシステム上で完結するため、ビッグデータ関連の業務に携わる場合は、Linuxシステムの操作方法や関連コマンドを習得する必要があります。

3. Hadoop

Hadoop は、大量のデータを分散処理できるソフトウェア フレームワークです。HDFS と MapReduce はその中核設計です。HDFS は大量のデータにサービスを提供します。 MapReduce はストレージに加えて、大量のデータの計算を提供し、ビッグ データ開発に不可欠なフレームワーク スキルです。

4. Zookeeper

ZooKeeper は、分散型のオープンソースの分散アプリケーション調整サービスであり、Google の Chubby のオープンソース実装であり、Hadoop と An の統合です。 Hbase の重要なコンポーネント。分散アプリケーションに一貫したサービスを提供するソフトウェアであり、構成保守、ドメイン名サービス、分散同期、グループ サービスなどの機能が提供されます。

5. Hive

hive は、Hadoop ベースのデータ ウェアハウス ツールで、構造化データ ファイルをデータベース テーブルにマップし、単純な SQL を提供できます。 SQL ステートメントを MapReduce タスクに組み込んで実行します。これは、データ ウェアハウスの統計分析に非常に適しています。

6, Hbase

これは Hadoop エコシステムの NOSQL データベースです。そのデータはキーと値の形式で保存され、キーは一意であるため、データの重複排除に使用できます。MYSQL と比較して、はるかに大量のデータを保存できます。

7. Kafka

Kafka は、高スループットの分散型分散型です。消費者規模の Web サイトですべてのアクション フロー データを処理し、Hadoop の並列読み込みメカニズムを通じてオンラインとオフラインのメッセージ処理を統合し、クラスターを通じてリアルタイム メッセージを提供できるパブリッシュ/サブスクライブ メッセージング システムです。

8. Spark

Spark は、大規模なデータ処理用に設計された高速で汎用的なコンピューティング エンジンであり、Hadoop MapReduce の利点を備えていますが、MapReduce との違いは中間出力結果です。メモリに保存できるため、HDFS の読み書きが不要になるため、Spark は、データ マイニングや機械学習など、反復を必要とする MapReduce アルゴリズムに適しています。

以上がビッグデータから何を学ぶかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

SublimeText3 Linux 新バージョン

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

WebStorm Mac版

WebStorm Mac版

便利なJavaScript開発ツール