検索
ホームページデータベースmysql チュートリアルMySQL インデックス構造の深い理解

この記事では、mysql に関する関連知識を提供し、主にインデックス構造に関する関連問題を紹介します。なぜインデックス作成がこれほど高速になるのでしょうか?以下で見てみましょう。皆さんのお役に立てれば幸いです。

MySQL インデックス構造の深い理解

推奨学習: mysql チュートリアル

データベース ストレージ ユニット

まず、次のことを知っておく必要があります。永続化を実現するには、インデックスはハードディスクにのみ保存できますが、インデックスを介してクエリを実行すると、ハードディスクへの I/O 操作が発生するため、インデックスを設計する際には、インデックスの数を減らす必要があります。可能な限り検索を行うことで、I/O にかかる時間を削減します。

さらに、非常に重要な原則を知っておく必要があります。データベース管理の記憶域スペースの基本単位は ページ (Page) であり、複数の行レコード (Row) が 1 つのページに保存されます。 。

コンピュータ システムは、ディスク I/O の 先読み 最適化を実行します。I/O が実行されると、現在のディスク アドレスのデータに加えて、隣接するデータも実行されます。メモリ バッファ プールでは、各 I/O で読み取られるデータは 1 ページになります。InnoDB のデフォルトのページ サイズは 16KB です。 MySQL インデックス構造の深い理解
64 の連続したページは エクステント を形成し、1 つ以上のエクステントは セグメント を形成し、1 つ以上のセグメントは テーブルスペース を形成します。 InnoDB には 2 つのテーブル スペース タイプがあります。共有テーブル スペースとは、複数のテーブルが 1 つのテーブル スペースを共有することを意味します。独立テーブル スペースとは、各テーブルのデータとインデックスがすべて独立したテーブル スペースに格納されることを意味します。

データ ページの構造は次のとおりです (出典: Geek Time "MySQL Must Know"):
MySQL インデックス構造の深い理解
データ ページの 7 つの構造コンテンツは、次のように大別できます。次の 3 つのカテゴリ:

  • ファイルの一般部分。ページ送信の完全性を検証するために使用されます。
    • ファイル ヘッダー: ページ情報を表します。FIL_PAGE_PREV および FIL_PAGE_NEXT は、ファイル ヘッダーで使用されます。それぞれ双方向リンク リストを形成し、前と次のデータ ページを指します。
    • ファイル ヘッダー: ページのステータス情報を記録します。
    • ファイル トレーラー: ページが完了したかどうかを確認します。
  • データの保存に使用されるレコード部分records
    • 最大レコードと最小レコード (Infimum/Supremum): データ ページの最大レコードと最小レコードを表す仮想行レコード。
    • ユーザー レコードと空き領域: データ行レコードのコンテンツを保存するために使用されます。
  • インデックス パーツ。レコードの取得効率を向上させるために使用されます。
    • ページ ディレクトリ:ユーザー レコードが保存される相対的な場所

詳細については、タオバオのデータベース カーネル月次レポートを参照してください

インデックス データの構造

当然のことながら、二分探索ツリー、二分平衡ツリーなど、検索アルゴリズムに関連するいくつかの一般的なデータ構造について考えます。実際、Innodb のインデックスは B Tree を使用して実装されています。なぜこのインデックスが実装されているかを見てみましょう。構造が選ばれました。

二分木の制限事項

二分探索木の定義を簡単におさらいしましょう。二分探索木では、検索対象のキーがルート ノードより大きい場合、検索でルート ノードが検索されます。右のサブツリー。キーがルート ノードより小さい場合は、キーが見つかるまで左のサブツリーを検索します。時間計算量は O(logn) です。たとえば、シーケンス [4,2,6,1,3,5,7] は次の二分探索ツリーを生成します:
MySQL インデックス構造の深い理解
ただし、一部の特殊なケースでは、二分木の深さはたとえば、[1,2,3,4,5,6,7] は次のツリーを生成します:
MySQL インデックス構造の深い理解
次の状況では、最悪の場合、 7回の確認で目的の結果が得られ、クエリ時間はO(n)となります。

この状況を最適化するために、平衡二分探索木 (AVL ツリー) が存在します。AVL ツリーとは、左右の部分木の高さの差が 1 を超えない木を指します。時間計算量は O(logn) であり、これはすでに理想的な検索ツリーですが、数千万行のレコードを持つデータベースでは、ツリーの深さは依然として非常に高く、依然として最も理想的な構造ではありません。

B ツリー

したがって、二分木から N 分木に拡張すると、N 分木によって木の深さが大幅に削減されることは容易に想像できます。実際、4 層のツリー構造はすでに数十テラバイトのデータをサポートできます。

B ツリー (バランス ツリー) は、このような N 分木です。B ツリーは B ツリーとも呼ばれ、次の定義を満たします:
B ツリーの次数を k とします (ノードが持つことができる子ノードの最大数)、

  1. 各ディスク ブロックには、最大 k - 1 個のキーワードと子ノードへの k ポインタが含まれます。
  2. リーフ ノードには、キーワードのみが含まれ、子ノード ポインタ
  3. 各ノード内のキーワードは昇順に配置されます。各キーワードの左側のサブツリー内のすべてのキーワードはそれより小さく、右側のサブツリー内のキーワードはそれより小さくなります。すべてのキーワードは大きいです。それよりも。
  4. すべてのリーフ ノードは同じレイヤー上にあります。

上で述べたように、各 I/O は 1 ページのサイズのディスク ブロックのデータを事前に読み取ります。ディスク ブロックの内容は I/O を表すために使用されます。 B ツリーの構造は次のとおりです (出典: Geek Time SQL が知っておくべき):
MySQL インデックス構造の深い理解
B ツリーも順序付けされており、子ノード ポインターはキーワードより 1 大きい必要があるため、ノードのセクションは、図の例のように、ディスク ブロック 2 のように、各ノードには 2 つのキーと 3 つの子ノードがあり、最初のバイト ポイントのキーは 3 です。 、 5 は最初の子ノード 8 より小さく、2 番目の子ノードの 9、10 は 8 と 12 の間にあり、3 番目の子ノードの値 13、15 はそれ自体の 2 番目の子ノード 12 より大きくなります。

今 9 を見つけたいとします。手順は次のとおりです。

  1. ルート ノードのディスク ブロック 1 (17,35) と比較すると、17 未満です。続行します。ポインタ P1 を検索するには、対応するディスク ブロック 2
  2. がディスク ブロック 2 (8,12) と比較され、この 2 つの間に位置し、ディスク ブロック 6# に対応するポインタ P2 で検索を続けます。
  3. ## とディスク ブロック 6 (9, 10) を比較して 9
を見つけます。多くの比較操作が実行されましたが、事前読み取りにより、ディスク ブロックはメモリ内で実行され、ディスク I/O を消費しません。上記の操作は完了するまでに 3 I/O 回しか必要とせず、これはすでに理想的な構造です。

B-tree インデックス

B-tree は、B-tree をベースにさらに改良されたもので、B-tree との違いは次のとおりです。

B ツリーの構築方法では、親ノードのキーワードについて、左側のサブツリーのすべてのキーワードはそれより小さく、右側のサブツリーのすべてのキーワードはそれ以上になります。

    非リーフ ノードはインデックス作成にのみ使用され、データ レコードは保存されません
  1. 親ノードのキーワードは子ノードにも表示され、それらは最大値になります。子ノードの (または最小値)
  2. すべてのキーワードが表示されます。リーフ ノードのうち、リーフ ノードは、小さいものから大きいものへと並べ替えられた、順序付けされたリンク リストを形成します。
  3. #例は次のとおりです。この例では、親ノードのキーワードは子ノードの中での最小値です (出典: Geek Time SQL が知っておくべき):
  4. 仮定 キーワード 16 を見つけるための検索手順は次のとおりです。

MySQL インデックス構造の深い理解ルート ノード ディスク 1 (1,18,35) と比較し、16 は 1 と 18 の間にあり、ポインタ P1 を取得します。 、ディスク 2 を指します

ディスク 2 (1,8,14) を検索します。16 は 14 より大きいです。ポインタ P3 を取得します。ディスク 7 を指します
  1. ディスク 7 (14,16, 17)、16
  2. B ツリーの利点:
  3. # 内部ノードはデータを保存しないため、各内部ノードが保存できるレコードの数は、B ツリーよりもはるかに多くなります。 B ツリーのそれです。ツリーの高さは低く、I/O は少なくなります。I/O のたびに読み取られるデータ ページには、より多くのコンテンツがあります。

範囲クエリをサポートできます。リーフ ノード

    すべてのデータはリーフ ノードに保存されるため、クエリ効率がより安定します
  1. HASH インデックス
  2. MySQL のメモリ ストレージ エンジンのデフォルトのインデックス構造はハッシュインデックスです。ハッシュとは、特定のアルゴリズム(MD5、SHA1、SHA2など)を通過させ、任意の長さの入力を固定長の出力に変換するハッシュ関数と呼ばれる関数です。入力と出力は、次のように対応します。この記事ではハッシュ関数については詳しく説明しませんので、詳細については百度百科を参照してください。
ハッシュ検索効率はO(1)と非常に効率的です。Pythonのdict、golangのmap、javaのハッシュマップはすべてハッシュをベースに実装されています。RedisなどのKey-Valueデータベースも実装されています。ハッシュ。

正確な検索を行うには、B ツリー インデックスよりもハッシュ インデックスの方が効率的ですが、ハッシュ インデックスにはいくつかの制限があるため、最も主流のインデックス構造ではありません。

ハッシュ インデックスが指すデータは順序付けされていないため、ハッシュ インデックスは範囲クエリを実行できず、ORDER BY 並べ替えもサポートしません。

ハッシュは完全一致であるため、あいまいクエリは実行できません。

    ハッシュ インデックスは、ジョイント インデックスの左端の一致原則をサポートしていません。ジョイント インデックスは、完全に一致する場合にのみ有効になります。ハッシュ インデックスは、各インデックスの個別のハッシュ値を計算するのではなく、インデックスをマージしてからハッシュ値を一緒に計算することによってハッシュ値を計算するためです。
  1. インデックス付きフィールドに重複する値が多数ある場合、大量のハッシュ競合が発生し、クエリに非常に時間がかかります。
  2. 上記の理由により、Mysql InnoDB エンジンはハッシュ インデックスをサポートしていませんが、メモリ構造には適応型ハッシュ インデックス機能があり、インデックス値が非常に頻繁に使用される場合、 in B ツリー インデックスに基づいて、
  3. はクエリのパフォーマンスを向上させるためにハッシュ インデックスを自動的に作成します。
  4. アダプティブ ハッシュ インデックスは、一種の「インデックスのインデックス」として理解できます。ハッシュ インデックスは、B ツリー インデックスにページ アドレスを格納し、対応するリーフ ノードを迅速に見つけるために使用されます。これは、innodb_adaptive_hash_index 変数を通じて表示できます。

    推奨学習: mysql チュートリアル

以上がMySQL インデックス構造の深い理解の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事はCSDNで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
MySQLの学習:新しいユーザー向けの段階的なガイドMySQLの学習:新しいユーザー向けの段階的なガイドApr 19, 2025 am 12:19 AM

MySQLは、データストレージ、管理、分析に適した強力なオープンソースデータベース管理システムであるため、学習する価値があります。 1)MySQLは、SQLを使用してデータを操作するリレーショナルデータベースであり、構造化されたデータ管理に適しています。 2)SQL言語はMySQLと対話するための鍵であり、CRUD操作をサポートします。 3)MySQLの作業原則には、クライアント/サーバーアーキテクチャ、ストレージエンジン、クエリオプティマイザーが含まれます。 4)基本的な使用には、データベースとテーブルの作成が含まれ、高度な使用にはJoinを使用してテーブルの参加が含まれます。 5)一般的なエラーには、構文エラーと許可の問題が含まれ、デバッグスキルには、構文のチェックと説明コマンドの使用が含まれます。 6)パフォーマンスの最適化には、インデックスの使用、SQLステートメントの最適化、およびデータベースの定期的なメンテナンスが含まれます。

MySQL:初心者が習得するための必須スキルMySQL:初心者が習得するための必須スキルApr 18, 2025 am 12:24 AM

MySQLは、初心者がデータベーススキルを学ぶのに適しています。 1.MySQLサーバーとクライアントツールをインストールします。 2。selectなどの基本的なSQLクエリを理解します。 3。マスターデータ操作:テーブルを作成し、データを挿入、更新、削除します。 4.高度なスキルを学ぶ:サブクエリとウィンドウの関数。 5。デバッグと最適化:構文を確認し、インデックスを使用し、選択*を避け、制限を使用します。

MySQL:構造化データとリレーショナルデータベースMySQL:構造化データとリレーショナルデータベースApr 18, 2025 am 12:22 AM

MySQLは、テーブル構造とSQLクエリを介して構造化されたデータを効率的に管理し、外部キーを介してテーブル間関係を実装します。 1.テーブルを作成するときにデータ形式と入力を定義します。 2。外部キーを使用して、テーブル間の関係を確立します。 3。インデックス作成とクエリの最適化により、パフォーマンスを改善します。 4.データベースを定期的にバックアップおよび監視して、データのセキュリティとパフォーマンスの最適化を確保します。

MySQL:説明されている主要な機能と機能MySQL:説明されている主要な機能と機能Apr 18, 2025 am 12:17 AM

MySQLは、Web開発で広く使用されているオープンソースリレーショナルデータベース管理システムです。その重要な機能には、次のものが含まれます。1。さまざまなシナリオに適したInnodbやMyisamなどの複数のストレージエンジンをサポートします。 2。ロードバランスとデータバックアップを容易にするために、マスタースレーブレプリケーション機能を提供します。 3.クエリの最適化とインデックスの使用により、クエリ効率を改善します。

SQLの目的:MySQLデータベースとの対話SQLの目的:MySQLデータベースとの対話Apr 18, 2025 am 12:12 AM

SQLは、MySQLデータベースと対話して、データの追加、削除、変更、検査、データベース設計を実現するために使用されます。 1)SQLは、ステートメントの選択、挿入、更新、削除を介してデータ操作を実行します。 2)データベースの設計と管理に作成、変更、ドロップステートメントを使用します。 3)複雑なクエリとデータ分析は、ビジネス上の意思決定効率を改善するためにSQLを通じて実装されます。

初心者向けのMySQL:データベース管理を開始します初心者向けのMySQL:データベース管理を開始しますApr 18, 2025 am 12:10 AM

MySQLの基本操作には、データベース、テーブルの作成、およびSQLを使用してデータのCRUD操作を実行することが含まれます。 1.データベースの作成:createdatabasemy_first_db; 2。テーブルの作成:createTableBooks(idintauto_incrementprimarykey、titlevarchary(100)notnull、authorvarchar(100)notnull、published_yearint); 3.データの挿入:InsertIntoBooks(タイトル、著者、公開_year)VA

MySQLの役割:WebアプリケーションのデータベースMySQLの役割:WebアプリケーションのデータベースApr 17, 2025 am 12:23 AM

WebアプリケーションにおけるMySQLの主な役割は、データを保存および管理することです。 1.MYSQLは、ユーザー情報、製品カタログ、トランザクションレコード、その他のデータを効率的に処理します。 2。SQLクエリを介して、開発者はデータベースから情報を抽出して動的なコンテンツを生成できます。 3.MYSQLは、クライアントサーバーモデルに基づいて機能し、許容可能なクエリ速度を確保します。

MySQL:最初のデータベースを構築しますMySQL:最初のデータベースを構築しますApr 17, 2025 am 12:22 AM

MySQLデータベースを構築する手順には次のものがあります。1。データベースとテーブルの作成、2。データの挿入、および3。クエリを実行します。まず、createdAtabaseおよびcreateTableステートメントを使用してデータベースとテーブルを作成し、InsertINTOステートメントを使用してデータを挿入し、最後にSelectステートメントを使用してデータを照会します。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境