データ処理要件の継続的なアップグレードとビッグデータ アプリケーションの普及に伴い、データ ストリーム処理テクノロジは近年広く使用されています。データ ストリーム処理テクノロジの目的は、データ ストリーム内のデータをリアルタイムで処理し、処理プロセス中に新しいデータ ストリームの結果を同時に生成することです。 PHP はデータ処理をサポートする非常に人気のある Web プログラミング言語であり、PHP7.0 バージョン以降、ジェネレーター、クロージャー、タイプ ヒントなど、データ フロー処理のニーズを満たすいくつかの新機能が導入されました。この記事では、PHP がデータ ストリーム処理テクノロジとどのように統合されるかを紹介します。
1. データ ストリーム処理とは何ですか?
つまり、データ フロー処理は、データ ストリームを処理するテクノロジです。リアルタイムでデータを処理する方法です。バッチ処理とは異なり、複数のソースからの連続データを処理できます。データ フロー処理の処理結果は、下流の処理ノードに直接送信することも、ストレージ デバイスに保存することもできます。
2. PHP はデータ ストリーム処理をどのように実装しますか?
以前のバージョンでは、PHP はストリーム データを直接操作できず、開発者は他の言語のライブラリを介してのみ操作できました。しかし、PHP7.0 バージョン以降、PHP はジェネレーター、クロージャー、その他の機能を導入し、PHP がデータ ストリーム処理をサポートできるようになりました。
1. ジェネレーター
ジェネレーターは、PHP の新機能の 1 つです。イテレーターを生成するためのより柔軟な方法を提供できます。ジェネレーター関数は、処理ロジックとイテレーター関数を組み合わせることができます。データを生成するストリーム。次の例を考えてみましょう。
function dataGenerator($n){ for($i=0;$i<$n;$i++){ yield $i; } } $data = dataGenerator(10); foreach($data as $entry){ echo $entry.PHP_EOL; }
上記のコードを通じて、dataGenerator 関数によって生成された一連のデータ ポイントをデータ ストリームとして処理できることがわかります。ジェネレーター関数を使用してデータ ストリームを操作する利点は、データ セットの処理時にメモリ使用量を最適化し、メモリ オーバーヘッドを削減できることです。
2. Closure
Closure は、PHP のもう 1 つの新機能で、外部スコープで定義された変数をキャプチャし、実際の実行プロセス中にこれらの変数を使用できる匿名関数です。クロージャは通常、データ ストリームを処理するためにジェネレータと一緒に使用されます。
次の例を考えてみましょう:
$data = [1, 2, 3, 4]; $mapper = function($value){ return $value * $value; }; $closure = function($data,$mapper){ foreach($data as $entry) { yield $mapper($entry); } }; $stream = $closure($data,$mapper); foreach($stream as $entry){ echo $entry.PHP_EOL; }
上記のコードは、クロージャを使用してデータ フローを実装し、データ ソース $data の値を 2 乗して返します。クロージャは、関数をオブジェクトとして扱い、データ ストリーム間での受け渡しを容易にする強力なメカニズムを提供します。
3. データ ストリーム処理フレームワーク
PHP7.0 はすでにデータ ストリーム処理をサポートしていますが、データ ストリームをより簡単に処理するために、サードパーティのデータ ストリーム処理フレームワークを使用できます。以下では、PHP の 2 つの古典的なデータ フロー処理フレームワークを紹介します。
1. ReactPHP
ReactPHP は、高パフォーマンスの非同期アプリケーションの構築に使用できるイベント駆動型プログラミング フレームワークで、Web アプリケーション、HTTP サーバー、およびソケット サーバーをサポートします。 ReactPHP はシングルスレッドのイベント ループ モデルに基づいており、複数の並列リクエストを処理し、イベントに応答してストリーミング データを生成します。
ReactPHP を使用してデータ ストリーム処理を実装するコードは次のとおりです:
$stream = new ReactStreamReadableResourceStream( fopen(__DIR__ . '/../fixture/lorem-ipsum.txt', 'r'), $loop ); $stream->on('data', function($data) use ($output) { $output->write($data); echo $data; });
上記のコードでは、ReactPHP のイベント ループ メカニズムを使用してデータ ストリームを作成します。イベント ループでは、$stream がデータを読み取り、コールバック関数を継続的にトリガーしてデータの流入を処理します。
2. Fractal
Fractal は、PHP でデータ フロー処理を実装するライブラリです。このライブラリは主にデータの書式設定と変換に使用されます。Fractal を使用すると、複数の階層でデータを作成できます。 。
Fractal は、データ ストリーム処理の強力なサポートが必要な次の 2 つの状況を処理するためによく使用されます:
(1) 特定の応答形式を段階的に構築したい場合、Fractal は次のような処理を行うことができます。保存コードがないため、グループ化されたデータまたは属性は大きく異なります;
(2) データ層が異なる物理アドレス上にある場合、これらのデータ ストリームをマージすると同時実行パフォーマンスが向上します。データ ストリームは複雑かつ柔軟に処理できます。
例:
$books = [ [ "id" => 1, "title" => 'A Game of Thrones', "author_name" => 'George R. R. Martin', "currency" => 'USD', "price" => 19.99 ] ]; $manager = new LeagueFractalManager(); $resource = new LeagueFractalResourceCollection($books, function ($book) { return [ 'id' => (int) $book['id'], 'title' => $book['title'], 'author' => [ "name" => $book['author_name'], ], 'price' => [ 'currency' => $book['currency'], 'amount' => $book['price'] ] ]; }); $manager->setSerializer(new LeagueFractalSerializerJsonApiSerializer()); $json = $manager->createData($resource)->toJson(); echo $json.PHP_EOL;
上記のコードでは、Fractal の Manager と Collection を使用してデータ フロー処理を実装しています。 Manager はデータのシリアル化の詳細を処理するために使用され、Collection は送信フォーマットを構築するために使用されます。ここでは、JsonApiSerializer をシリアル化ツールとして使用して、JSON 形式のデータ ストリームを生成します。
4. 結論
データフロー技術の革新と普及は、今後のデータ処理分野のさらなる発展にとって非常に重要です。この記事では、PHP7.0の新機能、ClosureやGeneratorの使い方、FractalやReactPHPなどのデータフロー処理フレームワークの実践など、PHPにおけるデータフロー処理技術の活用法を中心に紹介します。ビッグデータ アプリケーションの継続的な進歩に伴い、データ ストリーム処理テクノロジは将来さらに広く使用されるようになると考えられています。
以上がPHPとデータフロー処理の統合の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。