検索
ホームページ運用・保守ApacheApache Sparkとは何ですか

Apache Sparkとは何ですか

Jun 28, 2019 pm 01:52 PM
apachespark

Apache Sparkとは何ですか

Spark は、メモリ コンピューティングに基づくオープン ソースのクラスター コンピューティング システムであり、データ分析の高速化を目的としています。 Spark は非常に小さく精巧で、カリフォルニア大学バークレー校の AMP 研究所の Matei が率いる小規模チームによって開発されました。使用されている言語は Scala で、プロジェクトのコア部分のコードには 63 個の Scala ファイルしかなく、非常に短く簡潔です。

Spark は、Hadoop に似たオープン ソースのクラスター コンピューティング環境ですが、この 2 つの間にはいくつかの違いがあります。これらの有益な違いにより、Spark は特定のワークロードにおいて優れています。言い換えれば、Spark は、次のようなインメモリ分散データセットを可能にします。インタラクティブなクエリを提供できることに加えて、反復的なワークロードを最適化します。

Spark は Scala 言語で実装されており、アプリケーション フレームワークとして Scala を使用します。 Hadoop とは異なり、Spark と Scala は緊密に統合されており、Scala を使用すると、分散データ セットをローカル コレクション オブジェクトと同じくらい簡単に操作できます。

Spark は分散データ セットでの反復ジョブをサポートするために作成されましたが、実際には Hadoop を補完するものであり、Hadoop ファイル システム上で並列実行できます。この動作は、Mesos と呼ばれるサードパーティのクラスター フレームワークを通じてサポートされています。カリフォルニア大学バークレー校の AMP ラボ (アルゴリズム、マシン、およびピープル ラボ) によって開発された Spark を使用して、大規模な低遅延データ分析アプリケーションを構築できます。

Spark クラスター コンピューティング アーキテクチャ
Spark には Hadoop との類似点がありますが、有益な違いがある新しいクラスター コンピューティング フレームワークを提供します。まず、Spark は、クラスター コンピューティングにおける特定の種類のワークロード、つまり並列操作間で作業データ セット (機械学習アルゴリズムなど) を再利用するワークロード向けに設計されています。このようなタイプのワークロードを最適化するために、Spark はインメモリ クラスター コンピューティングの概念を導入しています。この概念では、データ セットがメモリ内にキャッシュされてアクセス レイテンシーが短縮されます。

Spark では、Resilient Distributed Dataset (RDD) と呼ばれる抽象化も導入しています。 RDD は、一連のノードに分散された読み取り専用オブジェクトのコレクションです。これらのコレクションは回復力があり、データ セットの一部が失われた場合でも再構築できます。部分的なデータセットを再構築するプロセスは、「リネージ」(つまり、データ導出プロセスに基づいてデータセットの部分的な再構築を可能にする情報)を維持するフォールト トレラント メカニズムに依存します。 RDD は、ファイルから作成できる Scala オブジェクト、並列化されたスライス (ノード全体に分散)、RDD の別の変換された形式、そして最終的にはキャッシュされたリクエストなどの既存の RDD の永続性への完全な変更として表されます。記憶の中で。

Spark のアプリケーションはドライバーと呼ばれ、これらのドライバーは単一ノード上で、または一連のノード上で並行して実行される操作を実装します。 Hadoop と同様に、Spark は単一ノード クラスターまたはマルチノード クラスターをサポートします。マルチノード操作の場合、Spark は Mesos クラスター マネージャーに依存します。 Mesos は、分散アプリケーションのリソース共有と分離のための効率的なプラットフォームを提供します。この設定により、Spark と Hadoop がノードの共有プール内で共存できるようになります。

Apache に関連する技術的な記事については、Apache チュートリアル 列にアクセスして学習してください。

以上がApache Sparkとは何ですかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
Apacheの利点:パフォーマンスと柔軟性Apacheの利点:パフォーマンスと柔軟性Apr 14, 2025 am 12:08 AM

Apacheのパフォーマンスと柔軟性により、Webサーバーで際立っています。 1)パフォーマンスの利点は、マルチプロセスおよびマルチスレッドモデルを通じて実装される効率的な処理とスケーラビリティに反映されます。 2)柔軟性は、モジュラー設計と構成の柔軟性に起因し、モジュールをロードし、要件に応じてサーバーの動作を調整できます。

Apache80ポートが占有されている場合はどうすればよいですかApache80ポートが占有されている場合はどうすればよいですかApr 13, 2025 pm 01:24 PM

Apache 80ポートが占有されている場合、ソリューションは次のとおりです。ポートを占有するプロセスを見つけて閉じます。ファイアウォールの設定を確認して、Apacheがブロックされていないことを確認してください。上記の方法が機能しない場合は、Apacheを再構成して別のポートを使用してください。 Apacheサービスを再起動します。

Apacheを開始できない問題を解決する方法Apacheを開始できない問題を解決する方法Apr 13, 2025 pm 01:21 PM

Apacheは、次の理由で起動できません。構成ファイル構文エラー。他のアプリケーションポートとの競合。権限の問題。メモリから。デッドロックを処理します。デーモン障害。 Selinux許可の問題。ファイアウォールの問題。ソフトウェアの競合。

ApacheでCGIディレクトリを設定する方法ApacheでCGIディレクトリを設定する方法Apr 13, 2025 pm 01:18 PM

ApacheでCGIディレクトリを設定するには、次の手順を実行する必要があります。「CGI-Bin」などのCGIディレクトリを作成し、Apacheの書き込み許可を付与します。 Apache構成ファイルに「Scriptalias」ディレクティブブロックを追加して、CGIディレクトリを「/cgi-bin」URLにマッピングします。 Apacheを再起動します。

Apacheバージョンを表示する方法Apacheバージョンを表示する方法Apr 13, 2025 pm 01:15 PM

Apacheサーバーでバージョンを表示するには3つの方法があります。コマンドライン(Apachectl -vまたはapache2ctl -v)を介して、サーバーステータスページ(http://< server ipまたはdomain name>/server -status)を確認します。

Apacheサーバーを再起動する方法Apacheサーバーを再起動する方法Apr 13, 2025 pm 01:12 PM

Apacheサーバーを再起動するには、次の手順に従ってください。Linux/MacOS:sudo systemctl restart apache2を実行します。 Windows:Net Stop apache2.4を実行し、ネット開始apache2.4を実行します。 Netstat -A |を実行しますサーバーのステータスを確認するには、STR 80を見つけます。

Apacheのサーバー名以上の削除方法Apacheのサーバー名以上の削除方法Apr 13, 2025 pm 01:09 PM

Apacheから追加のservernameディレクティブを削除するには、次の手順を実行できます。追加のservernameディレクティブを識別して削除します。 Apacheを再起動して変更を有効にします。構成ファイルを確認して、変更を確認します。サーバーをテストして、問題が解決されていることを確認します。

Apacheを始める方法Apacheを始める方法Apr 13, 2025 pm 01:06 PM

Apacheを開始する手順は次のとおりです。Apache(コマンド:sudo apt-get install apache2または公式Webサイトからダウンロード)をインストールします(linux:linux:sudo systemctl start apache2; windows:apache2.4 "serviceを右クリックして「開始」を右クリック) (オプション、Linux:Sudo SystemCtl

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

DVWA

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

WebStorm Mac版

WebStorm Mac版

便利なJavaScript開発ツール

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

PhpStorm Mac バージョン

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール