MySQL インデックス構造の深い理解-mysql チュートリアル-php.cn

ホームページ

データベース

mysql チュートリアル

MySQL インデックス構造の深い理解

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Mar 30, 2022 pm 06:13 PM

mysql

この記事では、mysql に関する関連知識を提供し、主にインデックス構造に関する関連問題を紹介します。なぜインデックス作成がこれほど高速になるのでしょうか?以下で見てみましょう。皆さんのお役に立てれば幸いです。

MySQL インデックス構造の深い理解

推奨学習: mysql チュートリアル

データベースストレージユニット

まず、次のことを知っておく必要があります。永続化を実現するには、インデックスはハードディスクにのみ保存できますが、インデックスを介してクエリを実行すると、ハードディスクへの I/O 操作が発生するため、インデックスを設計する際には、インデックスの数を減らす必要があります。可能な限り検索を行うことで、I/O にかかる時間を削減します。

さらに、非常に重要な原則を知っておく必要があります。データベース管理の記憶域スペースの基本単位は ページ (Page) であり、複数の行レコード (Row) が 1 つのページに保存されます。。

コンピュータシステムは、ディスク I/O の 先読み 最適化を実行します。I/O が実行されると、現在のディスクアドレスのデータに加えて、隣接するデータも実行されます。メモリバッファプールでは、各 I/O で読み取られるデータは 1 ページになります。InnoDB のデフォルトのページサイズは 16KB です。 MySQL インデックス構造の深い理解
64 の連続したページは エクステント を形成し、1 つ以上のエクステントは セグメント を形成し、1 つ以上のセグメントは テーブルスペース を形成します。 InnoDB には 2 つのテーブルスペースタイプがあります。共有テーブルスペースとは、複数のテーブルが 1 つのテーブルスペースを共有することを意味します。独立テーブルスペースとは、各テーブルのデータとインデックスがすべて独立したテーブルスペースに格納されることを意味します。

データページの構造は次のとおりです (出典: Geek Time "MySQL Must Know"):
MySQL インデックス構造の深い理解
データページの 7 つの構造コンテンツは、次のように大別できます。次の 3 つのカテゴリ:

ファイルの一般部分。ページ送信の完全性を検証するために使用されます。
- ファイルヘッダー: ページ情報を表します。FIL_PAGE_PREV および FIL_PAGE_NEXT は、ファイルヘッダーで使用されます。それぞれ双方向リンクリストを形成し、前と次のデータページを指します。
- ファイルヘッダー: ページのステータス情報を記録します。
- ファイルトレーラー: ページが完了したかどうかを確認します。
データの保存に使用されるレコード部分records
- 最大レコードと最小レコード (Infimum/Supremum): データページの最大レコードと最小レコードを表す仮想行レコード。
- ユーザーレコードと空き領域: データ行レコードのコンテンツを保存するために使用されます。
インデックスパーツ。レコードの取得効率を向上させるために使用されます。
- ページディレクトリ:ユーザーレコードが保存される相対的な場所

詳細については、タオバオのデータベースカーネル月次レポートを参照してください

インデックスデータの構造

当然のことながら、二分探索ツリー、二分平衡ツリーなど、検索アルゴリズムに関連するいくつかの一般的なデータ構造について考えます。実際、Innodb のインデックスは B Tree を使用して実装されています。なぜこのインデックスが実装されているかを見てみましょう。構造が選ばれました。

二分木の制限事項

二分探索木の定義を簡単におさらいしましょう。二分探索木では、検索対象のキーがルートノードより大きい場合、検索でルートノードが検索されます。右のサブツリー。キーがルートノードより小さい場合は、キーが見つかるまで左のサブツリーを検索します。時間計算量は O(logn) です。たとえば、シーケンス [4,2,6,1,3,5,7] は次の二分探索ツリーを生成します:
MySQL インデックス構造の深い理解
ただし、一部の特殊なケースでは、二分木の深さはたとえば、[1,2,3,4,5,6,7] は次のツリーを生成します:

次の状況では、最悪の場合、 7回の確認で目的の結果が得られ、クエリ時間はO(n)となります。

この状況を最適化するために、平衡二分探索木 (AVL ツリー) が存在します。AVL ツリーとは、左右の部分木の高さの差が 1 を超えない木を指します。時間計算量は O(logn) であり、これはすでに理想的な検索ツリーですが、数千万行のレコードを持つデータベースでは、ツリーの深さは依然として非常に高く、依然として最も理想的な構造ではありません。

B ツリー

したがって、二分木から N 分木に拡張すると、N 分木によって木の深さが大幅に削減されることは容易に想像できます。実際、4 層のツリー構造はすでに数十テラバイトのデータをサポートできます。

B ツリー (バランスツリー) は、このような N 分木です。B ツリーは B ツリーとも呼ばれ、次の定義を満たします:
B ツリーの次数を k とします (ノードが持つことができる子ノードの最大数)、

各ディスクブロックには、最大 k - 1 個のキーワードと子ノードへの k ポインタが含まれます。
リーフノードには、キーワードのみが含まれ、子ノードポインタ
各ノード内のキーワードは昇順に配置されます。各キーワードの左側のサブツリー内のすべてのキーワードはそれより小さく、右側のサブツリー内のキーワードはそれより小さくなります。すべてのキーワードは大きいです。それよりも。
すべてのリーフノードは同じレイヤー上にあります。

上で述べたように、各 I/O は 1 ページのサイズのディスクブロックのデータを事前に読み取ります。ディスクブロックの内容は I/O を表すために使用されます。 B ツリーの構造は次のとおりです (出典: Geek Time SQL が知っておくべき):
MySQL インデックス構造の深い理解
B ツリーも順序付けされており、子ノードポインターはキーワードより 1 大きい必要があるため、ノードのセクションは、図の例のように、ディスクブロック 2 のように、各ノードには 2 つのキーと 3 つの子ノードがあり、最初のバイトポイントのキーは 3 です。、 5 は最初の子ノード 8 より小さく、2 番目の子ノードの 9、10 は 8 と 12 の間にあり、3 番目の子ノードの値 13、15 はそれ自体の 2 番目の子ノード 12 より大きくなります。

今 9 を見つけたいとします。手順は次のとおりです。

ルートノードのディスクブロック 1 (17,35) と比較すると、17 未満です。続行します。ポインタ P1 を検索するには、対応するディスクブロック 2
がディスクブロック 2 (8,12) と比較され、この 2 つの間に位置し、ディスクブロック 6# に対応するポインタ P2 で検索を続けます。

を見つけます。多くの比較操作が実行されましたが、事前読み取りにより、ディスクブロックはメモリ内で実行され、ディスク I/O を消費しません。上記の操作は完了するまでに 3 I/O 回しか必要とせず、これはすでに理想的な構造です。

B-tree インデックス

B-tree は、B-tree をベースにさらに改良されたもので、B-tree との違いは次のとおりです。

B ツリーの構築方法では、親ノードのキーワードについて、左側のサブツリーのすべてのキーワードはそれより小さく、右側のサブツリーのすべてのキーワードはそれ以上になります。

親ノードのキーワードは子ノードにも表示され、それらは最大値になります。子ノードの (または最小値)
すべてのキーワードが表示されます。リーフノードのうち、リーフノードは、小さいものから大きいものへと並べ替えられた、順序付けされたリンクリストを形成します。
#例は次のとおりです。この例では、親ノードのキーワードは子ノードの中での最小値です (出典: Geek Time SQL が知っておくべき):
仮定キーワード 16 を見つけるための検索手順は次のとおりです。

MySQL インデックス構造の深い理解ルートノードディスク 1 (1,18,35) と比較し、16 は 1 と 18 の間にあり、ポインタ P1 を取得します。、ディスク 2 を指します

ディスク 2 (1,8,14) を検索します。16 は 14 より大きいです。ポインタ P3 を取得します。ディスク 7 を指します

ディスク 7 (14,16, 17)、16
B ツリーの利点:
# 内部ノードはデータを保存しないため、各内部ノードが保存できるレコードの数は、B ツリーよりもはるかに多くなります。 B ツリーのそれです。ツリーの高さは低く、I/O は少なくなります。I/O のたびに読み取られるデータページには、より多くのコンテンツがあります。

範囲クエリをサポートできます。リーフノード

HASH インデックス
MySQL のメモリストレージエンジンのデフォルトのインデックス構造はハッシュインデックスです。ハッシュとは、特定のアルゴリズム（MD5、SHA1、SHA2など）を通過させ、任意の長さの入力を固定長の出力に変換するハッシュ関数と呼ばれる関数です。入力と出力は、次のように対応します。この記事ではハッシュ関数については詳しく説明しませんので、詳細については百度百科を参照してください。

ハッシュ検索効率はO(1)と非常に効率的です。Pythonのdict、golangのmap、javaのハッシュマップはすべてハッシュをベースに実装されています。RedisなどのKey-Valueデータベースも実装されています。ハッシュ。

正確な検索を行うには、B ツリーインデックスよりもハッシュインデックスの方が効率的ですが、ハッシュインデックスにはいくつかの制限があるため、最も主流のインデックス構造ではありません。

ハッシュインデックスが指すデータは順序付けされていないため、ハッシュインデックスは範囲クエリを実行できず、ORDER BY 並べ替えもサポートしません。

ハッシュは完全一致であるため、あいまいクエリは実行できません。

インデックス付きフィールドに重複する値が多数ある場合、大量のハッシュ競合が発生し、クエリに非常に時間がかかります。
上記の理由により、Mysql InnoDB エンジンはハッシュインデックスをサポートしていませんが、メモリ構造には適応型ハッシュインデックス機能があり、インデックス値が非常に頻繁に使用される場合、 in B ツリーインデックスに基づいて、
アダプティブハッシュインデックスは、一種の「インデックスのインデックス」として理解できます。ハッシュインデックスは、B ツリーインデックスにページアドレスを格納し、対応するリーフノードを迅速に見つけるために使用されます。これは、innodb_adaptive_hash_index 変数を通じて表示できます。

推奨学習: mysql チュートリアル

以上がMySQL インデックス構造の深い理解の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事はCSDNで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

MySQLの学習：新しいユーザー向けの段階的なガイドApr 19, 2025 am 12:19 AM

MySQLは、データストレージ、管理、分析に適した強力なオープンソースデータベース管理システムであるため、学習する価値があります。 1）MySQLは、SQLを使用してデータを操作するリレーショナルデータベースであり、構造化されたデータ管理に適しています。 2）SQL言語はMySQLと対話するための鍵であり、CRUD操作をサポートします。 3）MySQLの作業原則には、クライアント/サーバーアーキテクチャ、ストレージエンジン、クエリオプティマイザーが含まれます。 4）基本的な使用には、データベースとテーブルの作成が含まれ、高度な使用にはJoinを使用してテーブルの参加が含まれます。 5）一般的なエラーには、構文エラーと許可の問題が含まれ、デバッグスキルには、構文のチェックと説明コマンドの使用が含まれます。 6）パフォーマンスの最適化には、インデックスの使用、SQLステートメントの最適化、およびデータベースの定期的なメンテナンスが含まれます。

MySQL：初心者が習得するための必須スキルApr 18, 2025 am 12:24 AM

MySQLは、初心者がデータベーススキルを学ぶのに適しています。 1.MySQLサーバーとクライアントツールをインストールします。 2。selectなどの基本的なSQLクエリを理解します。 3。マスターデータ操作：テーブルを作成し、データを挿入、更新、削除します。 4.高度なスキルを学ぶ：サブクエリとウィンドウの関数。 5。デバッグと最適化：構文を確認し、インデックスを使用し、選択*を避け、制限を使用します。

MySQL：構造化データとリレーショナルデータベースApr 18, 2025 am 12:22 AM

MySQLは、テーブル構造とSQLクエリを介して構造化されたデータを効率的に管理し、外部キーを介してテーブル間関係を実装します。 1.テーブルを作成するときにデータ形式と入力を定義します。 2。外部キーを使用して、テーブル間の関係を確立します。 3。インデックス作成とクエリの最適化により、パフォーマンスを改善します。 4.データベースを定期的にバックアップおよび監視して、データのセキュリティとパフォーマンスの最適化を確保します。

MySQL：説明されている主要な機能と機能Apr 18, 2025 am 12:17 AM

MySQLは、Web開発で広く使用されているオープンソースリレーショナルデータベース管理システムです。その重要な機能には、次のものが含まれます。1。さまざまなシナリオに適したInnodbやMyisamなどの複数のストレージエンジンをサポートします。 2。ロードバランスとデータバックアップを容易にするために、マスタースレーブレプリケーション機能を提供します。 3.クエリの最適化とインデックスの使用により、クエリ効率を改善します。

SQLの目的：MySQLデータベースとの対話Apr 18, 2025 am 12:12 AM

SQLは、MySQLデータベースと対話して、データの追加、削除、変更、検査、データベース設計を実現するために使用されます。 1）SQLは、ステートメントの選択、挿入、更新、削除を介してデータ操作を実行します。 2）データベースの設計と管理に作成、変更、ドロップステートメントを使用します。 3）複雑なクエリとデータ分析は、ビジネス上の意思決定効率を改善するためにSQLを通じて実装されます。

初心者向けのMySQL：データベース管理を開始しますApr 18, 2025 am 12:10 AM

MySQLの基本操作には、データベース、テーブルの作成、およびSQLを使用してデータのCRUD操作を実行することが含まれます。 1.データベースの作成：createdatabasemy_first_db; 2。テーブルの作成：createTableBooks（idintauto_incrementprimarykey、titlevarchary（100）notnull、authorvarchar（100）notnull、published_yearint）; 3.データの挿入：InsertIntoBooks（タイトル、著者、公開_year）VA

MySQLの役割：WebアプリケーションのデータベースApr 17, 2025 am 12:23 AM

WebアプリケーションにおけるMySQLの主な役割は、データを保存および管理することです。 1.MYSQLは、ユーザー情報、製品カタログ、トランザクションレコード、その他のデータを効率的に処理します。 2。SQLクエリを介して、開発者はデータベースから情報を抽出して動的なコンテンツを生成できます。 3.MYSQLは、クライアントサーバーモデルに基づいて機能し、許容可能なクエリ速度を確保します。

MySQL：最初のデータベースを構築しますApr 17, 2025 am 12:22 AM

MySQLデータベースを構築する手順には次のものがあります。1。データベースとテーブルの作成、2。データの挿入、および3。クエリを実行します。まず、createdAtabaseおよびcreateTableステートメントを使用してデータベースとテーブルを作成し、InsertINTOステートメントを使用してデータを挿入し、最後にSelectステートメントを使用してデータを照会します。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SublimeText3 中国語版

中国語版、とても使いやすい

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

ドリームウィーバー CS6

ビジュアル Web 開発ツール

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。