この記事は最初に InfoQ 中国語サイト に掲載されました。著者: Ming Ling (dragon)、Fenng 注: 転載したい友人は、この記事の最初の著者に注意してください
この記事は、ドラゴンの友人が議論するためにメールで作成した要約です。 DB またはアプリケーションでの並べ替えは、非常に興味深いトピックです。実際、Dragon は最初のメールでそれを非常によくまとめており、いくつかの提案を追加しました。さあ、それをアップしてみんなと共有しましょう。この記事は InfoQ 中国語ステーション にも投稿されました。
Q: PHP でソートを実行する方が MYSQL でソートするよりも優れている理由を挙げてください? MYSQL でソートを行う必要がある例をいくつか挙げてください。
A: 一般的に、実行効率はCPU、メモリ、ハードディスクなどの負荷条件を考慮する必要があります。MYSQLサーバーとPHPサーバーが最適な方法で構成されていると仮定すると、システムのスケーラビリティ(スケーラビリティ) とユーザーが認識するパフォーマンスが私たちが追求する主な目標です。実際の動作では、MYSQL のデータは HASH テーブルや BTREE などのメモリに保存されることが多く、その動作速度は非常に高速です。同時に、多くのアプリケーションでは INDEX が事前にソートを実行しています。最初の選択。アプリケーション層 (PHP) での並べ替えもメモリ内で実行する必要があります。MYSQL と比較すると、次の利点があります。
- 1. Web サイト全体のスケーラビリティと全体的なパフォーマンスを考慮すると、アプリケーション層 (PHP) での並べ替えは次のとおりです。明らかにデータベースの負荷が軽減され、Web サイト全体の拡張性が向上します。実際、データベースでのソートのコストは非常に高く、メモリと CPU を消費します。多くの同時ソートがある場合、DB は簡単にボトルネックに達します。
- 2. アプリケーション層 (PHP) と MYSQL の間にデータ中間層があり、それが適切に活用されると、PHP の利点がさらに高まります。
- 3. PHP のメモリ内データ構造は、特定のアプリケーション向けに特別に設計されており、データベースよりも簡潔で効率的です。
- 4. PHP はデータの災害復旧の問題を考慮する必要がなく、この部分の運用損失を軽減できます。
- 5. PHP にはテーブル ロックの問題はありません。
- 6. MYSQL での並べ替え、結果の要求と返しもネットワーク接続を介して実行する必要がありますが、PHP では並べ替え後に直接返すことができるため、ネットワーク IO が削減されます。
実行速度に関しては、アプリケーションの設計に問題があり、不要なネットワーク IO が大量に発生しない限り、その差は大きくはありません。また、アプリケーション層はPHPのキャッシュ設定に注意する必要があり、それを超えると内部エラーが報告されますので、アプリケーションに応じてキャッシュを評価または調整する必要があります。具体的な選択は、特定のアプリケーションによって異なります。
PHP での並べ替えの方が良い状況をいくつか挙げてください
1. データ ソースが MYSQL にない、ハードディスク、メモリ、ネットワークからのリクエストなどが存在する。
- 2. データは MYSQL に保存されており、量は多くなく、対応するインデックスがありません。現時点では、データを取り出して PHP でソートする方が高速です。
- 3. データ ソースは複数の MYSQL サーバーからのものです。現時点では、複数の MYSQL からデータを取得して PHP で並べ替える方が高速です。
- 4. MYSQL に加えて、ハードディスク、メモリ、ネットワークからのリクエストなどの他のデータ ソースもあります。現時点では、これらのデータを MYSQL に保存して並べ替えるのは適切ではありません。 MYSQL でソートする必要があります。 例:
-
1. このソートされたインデックスはすでに MYSQL に存在します。
2. MYSQL のデータ量は多く、結果セットには非常に小さなサブセットが必要です。たとえば、データが 1,000,000 行ある場合は、上位 10 行を取得します。
3. さまざまなサービスに提供できる統計集計など、1 つのソートと複数の呼び出しが必要な状況では、MYSQL でのソートが推奨されます。さらに、ディープ データ マイニングの場合、通常のアプローチでは、アプリケーション層でソートなどの複雑な操作を完了し、その結果を MYSQL に保存して、何度でも簡単に使用できるようにします。
4. データソースがどこから来たとしても、データ量が一定の規模に達すると、メモリ/キャッシュが占有されるため、PHP でのソートには適さなくなります。この時点で、データをコピーする必要があります。 MYSQL にインポートまたは保存され、 INDEX で最適化されたものは、PHP- よりも優れています。ただし、そのような操作は Java または C++ で処理する方がよいでしょう。 [大規模なデータ セットの集約または要約に似た一部のデータでは、クライアント側での並べ替えが利益と損失を上回ります。もちろん、検索エンジンと同様のアイデアを使用して、同様のアプリケーション状況を解決することもできます。 】
-
-
- ウェブサイトの全体的な検討には、人的資源とコストの考慮が含まれなければなりません。 Web サイトのサイズや負荷が小さく、人手が限られている場合 (人員や機能が制限される可能性があります)、アプリケーション層 (PHP) でのソートには多くの開発とデバッグ作業が必要となり、時間がかかります。損失に見合ったものであれば、DB で処理する方が良いでしょう。大規模な Web サイトの場合、電気代とサーバーのコストは非常に高くなります。システム アーキテクチャを慎重に計画することで、コストを大幅に節約できます。これは、アプリケーション層で処理できれば、現時点では企業の持続可能な発展に必要です。 (PHP) ビジネスニーズを満たすために、アプリケーション層でそれを実行してみてください。
上記では、PHP でのインターネット一時ファイルの並べ替えと MySQL での並べ替えについて、インターネット一時ファイルの内容も含めて紹介しました。PHP チュートリアルに興味のある友人に役立つことを願っています。