一般に、order by を実装するには 2 つの方法があります。1 つは、順序付きインデックスを使用して自動的に実装する方法です。つまり、順序付きインデックスの順序性を使用すると、追加の並べ替え操作は必要ありません。もう 1 つは、結果を選択した後に並べ替えることです。 順序付きインデックスを使用するのがもちろん最も高速ですが、いくつかの制限があります。以下のテストを見てみましょう。
テスト データ: Student テーブルには id、sid の 2 つのフィールドがあり、id が主キーです。合計 20W レコードがあり、ID の範囲は 1 ~ 200000、sids の範囲も 1 ~ 200000 です。
最初の状況:
order by フィールドは where 条件にも select にもありません。
sid を zhuyuehua.student から選択します (sid
#2 番目のケース:
order by フィールドはありませんwhere 条件ではありますが、select です。
select id,sid from zhuyuehua.student where sid
3 番目のケース:
order by フィールドは where 条件にはありますが、select にはありません。
sid を zhuyuehua.student から選択します (sid
#4 番目のケース:
order by フィールドは where 条件にはありますが、select にはありません。逆順に並べ替える
sid を zhuyuehua.student から選択します (sid
テスト結果:
order by のフィールドは where 条件にも select にもありません。並べ替え操作があります。
order by のフィールドが where 条件ではなく select にあります。ソート操作があります。
order by のフィールドは where 条件に含まれていますが、select には含まれていません。並べ替え操作はありません。
order by のフィールドは where 条件にありますが、select (逆順) にはありません。並べ替え操作はありません。
結論:
order by フィールドが where 条件に出現する場合、ソート操作を行わずにインデックスが使用されます。 その他の場合、order by は並べ替え操作を実行しません。
分析:
order by フィールドが where 条件に出現する場合にのみ、並べ替えを避けるためにフィールドのインデックスが使用されるのはなぜですか。 これは、データベースが必要なデータを取得する方法についてです。
#SQL は実際には 3 つのステップに分割できます。
1. データの取得
2. データの処理
3. 処理されたデータを返す
たとえば、上記のステートメント select sid from zhuyuehua.student where sid
ステップ 1: where 条件と統計情報に基づいて実行を生成します。計画を立ててデータを取得します。
ステップ 2: 取得したデータを並べ替えます。
データ処理 (order by) を実行するとき、データベースはまず最初のステップの実行計画をチェックして、order by のフィールドが実行計画のインデックスを使用しているかどうかを確認します。その場合は、インデックス順序を使用して、並べ替えられたデータを直接取得できます。 そうでない場合は、並べ替え操作を行います。
ステップ 3: 並べ替えられたデータを返します。
######加えて:
上記の 50,000 データの並べ替えには 25 ミリ秒しかかかりませんでした。並べ替えには多くのリソースが消費されないと思われるかもしれません。ただし、上記の表のデータは順序付けされているため、並べ替えにかかる時間は短くなります。比較的順序付けされていないテーブルの場合、ソート時間は大幅に増加します。また、ソート操作は通常、データベースの CPU 消費量であるメモリ上で実行されますが、CPU の性能が向上したため、通常の数十、数百件のレコードのソートはシステムに大きな影響を与えません。 。ただし、レコード セットが 100 万レコードを超えた場合は、これを行う必要があるかどうかに注意する必要があります。大規模なレコード セットを並べ替えると、CPU オーバーヘッドが増加するだけでなく、メモリ不足によりハード ディスクの並べ替えが発生する可能性があります。ハードディスクが発生する ソート時にパフォーマンスが大幅に低下します。
注: ORACLE または DB2 には、SORT 操作 (前述のメモリ ソート) 用のスペースがあります。たとえば、ORACLE では、SORT_AREA_SIZE などのパラメータの設定が含まれるユーザー グローバル領域 (UGA) です。ソートするデータ量が多い場合、ソートオーバーフロー(ハードディスクソート)が発生し、パフォーマンスが大幅に低下します。
要約:
order by のフィールドが where 条件に出現する場合、インデックスはソートなしで使用されます。より正確には、order by のフィールドは実行プラン内にあります。インデックスを使用する場合、ソート操作は必要ありません。 #この結論は、order by だけでなく、並べ替えが必要な他の操作にも当てはまります。たとえば、
group by、union、distinct
などです。 SQL に関するチュートリアルをさらに知りたい場合は、PHP 中国語 Web サイト
sql ビデオ チュートリアル
以上が[SQL 学習] 順序付きインデックスと順序付けの関係の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。