Redisのデータ構造を詳しく解説-Redis-php.cn

ホームページ

データベース

Redis

Redisのデータ構造を詳しく解説

青灯夜游

Mar 31, 2021 am 10:26 AM

javaredisシナリオの適用データ構造インタビュー

Redisのデータ構造を詳しく解説

実際の開発では、Redis が頻繁に使用されることになりますが、使用時にデータ型を正しく選択するにはどうすればよいでしょうか?どのデータ型がどのシナリオに適しているか。そして面接では、面接官が Redis のデータ構造についてよく質問します:

なぜ Redis は速いのですか?
クエリ操作が遅くなるのはなぜですか?
Redis ハッシュの再ハッシュプロセス
Redis のインデックスとしてハッシュテーブルを使用する理由

Redis データ構造を分析して理解したとき。これは、使用するデータ型を正しく選択し、Redis を使用する際のシステムパフォーマンスを向上させるのに役立ちます。 [関連する推奨事項: Redis ビデオチュートリアル ]

`Redis`基礎となるデータ構造

Redis はいmemorykey-valuekey-value データベース。キーと値のペアのデータは memory に保存されるため、Redis メモリ-ベースのデータ操作は、高効率かつ高速です;

このうち、Key は String 型で、Redis は ## をサポートします。 #value タイプ String、List、Hash、Set、Sorted Set、## を含む#BitMap お待ちください。 Redis これが多くのビジネスシナリオに広く適用できる理由は、その多様な種類の value に基づいています。

Redis

の Value のデータ型は、RedisredisObject 用にカスタマイズされたオブジェクトシステムに基づいています。実装済み、<pre class="brush:php;toolbar:false">typedef struct redisObject{ //类型 unsigned type:4; //编码 unsigned encoding:4; //指向底层实现数据结构的指针 void *ptr; ….. }</pre>

redisObject

実際のデータの記録に加えて、データ長、スペース使用量などのメタデータ情報を記録するために追加のメモリ領域も必要です。これには 8 バイトのメタデータが含まれます。および 8 バイトのポインター。ポインターは、特定のデータ型の実際のデータの場所を指します。

Redisのデータ構造を詳しく解説このうち、

ポインター

に基づく場所を指します Redis の基礎となるデータ構造には、データの場所が格納されます。Redis の基礎となるデータ構造は次のとおりです: SDS、二重リンクによって実装されますリスト、ジャンプテーブル、ハッシュテーブル、圧縮リスト、整数セット。では、Redis の基礎となるデータ構造はどのように実装されているのでしょうか?

Redis の基礎となるデータ構造の実装

Redis

比較的単純なSDS を見てみましょう。2 つ目は、リンクされたリスト、整数のセット。

SDS、二重リンクリストと整数セット

SDS

、len フィールドを使用使用されるバイト数により、文字列の長さを取得する複雑さが O(1) に軽減されます。また、SDS は 遅延解放スペース であるため、free を解放します。スペースにある場合、システムはデータを記録し、次回使用するときにそれを直接使用できます。新たにスペースを申請する必要はありません。
Redisのデータ構造を詳しく解説整数コレクション
、メモリ内に連続したアドレスを持つスペースを割り当てると、データ要素は並べて保存されます。スペースのオーバーヘッドをもたらす追加ポインタ。その特徴は、メモリがコンパクトでメモリ領域を節約し、クエリの複雑さが O(1) で効率が高く、その他の演算の複雑さが O(N) であることです。

二重リンクリスト

。これはメモリ内で非連続かつ非順次の空間にすることができ、要素間のシーケンスは追加のポインタオーバーヘッドを通じて直列に接続されます。フロントエンド/バックエンドポインタ。その特徴は、セクション内のデータの挿入/更新の複雑さは O(1)、高効率、クエリの複雑さは O(N) であることです。 #Hash

ha ハッシュテーブル

ハッシュテーブルは実際には配列に似ています。配列の各要素はハッシュバケットと呼ばれます。各ハッシュバケットにはキーと値のペアのデータが格納され、ハッシュbucket 要素は dictEntry `構造、`

を使用します。したがって、ハッシュバケット要素はキーと値のペア自体を保存しませんが、を指します特定の値
へのポインターです。そのため、各キーと値のペアを保存するときにスペースのオーバーヘッドが追加されます。少なくとも 24 バイトが追加されます。特に Redisのデータ構造を詳しく解説 Value は

です。 String

キーと値のペア。各キーと値のペアには追加の 24 バイトのスペースが必要です。保存されるデータが小さく、追加のオーバーヘッドがデータよりも大きい場合、スペースを節約するために、データ構造の変更を検討してください。

グローバルハッシュテーブルの全体像を見てみましょう:

ハッシュテーブルの操作は非常に高速ですが、Redisデータが大きくなると、潜在的なリスクが発生します: ハッシュテーブルの競合問題と rehash オーバーヘッドの問題 、これで、ハッシュテーブルの操作が遅くなる理由が説明できますか?


時間計算量
ハッシュテーブル	O(1)
整数配列	O( N)
二重リンクリスト	O(N)
圧縮リスト	O( N )


	`##読み取りのブロック`	BRPOP
	`重複メッセージ処理`	`#ストリームは自動的にグローバルに一意の ID を生成します`
	BRPOPLPUSH
	#適用可能なシナリオ`##メッセージの総量は少ないです`##メッセージの総量はサイズが大きく、データはコンシューマグループの形式で読み取る必要があります
GEO## を使用して実装されています	の # データ型	は地理的な位置情報を経度と緯度の形式で記録でき、LBS で広く使用されています。たとえば、タクシー配車ソフトウェアが位置に基づいてサービスを提供する方法などです。

より多くのデータをハッシュテーブルに書き込む場合、ハッシュの競合は避けられない問題です。Redis がハッシュの競合を解決する方法は Chained Hash であり、同じハッシュバケットに複数の要素が保存されます。

ハッシュの競合が増えると、これにより、一部のハッシュ競合チェーンが長くなり、このチェーン上の要素の検索に時間がかかり、効率が低下します。

ハッシュの競合によって引き起こされる長すぎるチェーンの問題を解決するには、rehash 操作を実行して既存のハッシュバケットの数を増やし、ハッシュバケットを分散させます。 single バケット要素の数。では、rehash
プロセスはどのように実行されるのでしょうか?
Rehash

rehash
操作をより効率的にするために、ハッシュテーブル 1 とハッシュテーブル 2 の 2 つのグローバルハッシュテーブルが使用されます。ハッシュテーブル 2 を次のようにします:

より大きなスペースをハッシュテーブル 2 に割り当てます。ハッシュテーブル 1 のデータを再マップし、それをテーブル 2 のハッシュにコピーします。

ハッシュテーブル 1 の領域を解放します。 ただし、リマップやコピーの際、テーブル 1 とテーブル 2 のデータサイズが大きいため、ハッシュテーブル 1 を一度に配置すると、すべてのデータが終わった後にが移行された場合、Redis スレッドはブロックされ、他のリクエストを処理できなくなります。この問題を回避し、Redi
がクライアントリクエストを正常に処理できるようにするために、
Redis
は
プログレッシブ rehash
## を採用しています。＃。
リクエストが処理されるたびに、インデックス位置にあるすべてのエントリがハッシュテーブル 1 からハッシュテーブル 2 にコピーされ、一度に大量にコピーされるオーバーヘッドは複数の処理の処理に割り当てられます。、時間のかかる操作を回避し、データへの高速アクセスを確保します。

Hash
ハッシュテーブルに関連する知識ポイントを理解した後、一般的ではない圧縮リストとスキップテーブルを見てみましょう。
圧縮リストとスキップテーブル
圧縮リスト
、配列に基づいて、圧縮リストのヘッダーには zlbytes、zltail の 3 つのフィールドがあります。 zllen と zllen は、それぞれリストの長さ、リストの終わりのオフセット、リスト内のエントリの数を表します。圧縮されたリストのテーブルの終わりには、リストの終わりを示す zlend もあります。

利点:
メモリがコンパクトでメモリ空間を節約メモリ上に連続したアドレスの空間を確保し、データ要素を格納しますスペースのオーバーヘッドを削減するため、最初の要素と最後の要素の検索と特定は、3 つのヘッダーフィールドの長さを通じて直接見つけることができ、複雑さは O(1) です。

ジャンプリスト
は、リンクリストに基づいてマルチレベルインデックスを追加し、次に示すようにインデックス位置での複数のジャンプを通じてデータの迅速な配置を実現します。図：
例：クエリ33
特徴：データ量が多い場合、スキップテーブルの検索複雑さはO(logN) 。要約すると、基礎となるデータ構造の時間計算量を知ることができます: データ構造タイプ

時間計算量

ハッシュテーブル O(1)

整数配列 O( N)

二重リンクリスト O(N)

圧縮リスト O( N )

ジャンプリスト######O(logN)############
Redisカスタムオブジェクトシステムタイプは、Redis の Value データ型です。Redis のデータ型は、基礎となるデータ構造が実装されている場合、データ型は何ですか?

Redis データ型

String、List、Hash、Sorted Set 、Set は比較的一般的な型であり、基礎となるデータ構造との対応関係は次のとおりです。
##ハッシュ圧縮リスト
ハッシュテーブル # ソートされたセット圧縮リスト
スキップリストセットハッシュテーブル
整数配列#
データ型の対応する特性は、その実装の基礎となるデータ構造に似ており、プロパティも同じです。また、
String は SDS に基づいて実装されており、適切です。単純な key-valueストレージ、setnx key valueの場合は、分散ロック、カウンター (アトミック性)、および分散グローバル一意 ID を実装します。
List は、FIFO (先入れ先出し) ルールに従い、要素が List に入る順序に従って並べ替えられ、通常は次の中で使用されます。統計のソートと単純なメッセージキュー。
Hash は、文字列 key と文字列 value の間のマッピングです。オブジェクト情報を表すのに非常に適しています。機能が追加されています。また、削除操作の複雑さは O(1) です。
Set は、String 型要素の順序付けされていないコレクションです。コレクションのメンバーは一意であるため、コレクション内に重複したデータが存在することはできません。ハッシュテーブルに基づいて実装されるため、追加、削除、検索の複雑さは O(1) です。
Sorted Set は Set タイプのアップグレードです。違いは、各要素が double タイプのスコアに関連付けられていることです。スコアをソートすることで、範囲クエリは次のようになります。可能。
それでは、これらのデータ型、Redis Geo、HyperLogLog、BitMap を見てみましょう。
Redis Geo は、地球を近似的な球として扱い、GeoHash に基づいて 2 次元の経度と緯度を文字列に変換し、位置の分割と指定された距離のクエリを実装します。機能は通常、位置情報関連のアプリケーションで使用されます。
HyperLogLog は、確率的アルゴリズムを使用してセットのおおよそのカーディナリティを約 0.81% のエラー率でカウントする probabilistic データ構造です。セット要素の数が非常に多い場合、カーディナリティの計算に必要なスペースは常に固定され、非常に小さいため、UV 統計に適しています。
BitMap は 1 ビットを使用して要素の状態をマップします。状態は 0 と 1 の 2 つだけです。これは非常に典型的なバイナリ状態であり、文字列型を基礎となる層. データ構造によって実装される統計的なバイナリ状態のデータタイプ。多くのメモリスペースを節約できるという利点があり、バイナリ統計のシナリオで使用できます。
上記の知識を理解した後、対応するアプリケーションシナリオで Redis データ型を選択するためにどのような戦略が使用されるかについて説明します。
適切な Redisデータ型戦略
実際の開発アプリケーションでは、Redis は多くのビジネスシナリオに適用できますが、必要なものは何ですか? ? データ型ストレージの選択についてはどうですか?
主な基礎は時間/空間の複雑さですが、実際の開発では次の点が考慮されます:
#データ量、データ自体のサイズ
コレクションタイプ統計モード
シングルポイントクエリ/範囲クエリをサポート
特別な使用シナリオ

データ量、データ自体のサイズ
データ量が比較的多く、データ自体が比較的小さい場合、
String を使用すると、余分なスペースの使用量が大幅に増加します。 table はキーと値のペアを保存するために使用され、dictEntry は使用されます 構造体を保存すると、各キーと値のペアを保存するときに dictEntry の 3 つの追加ポインターを保存するオーバーヘッドが発生します。データ自体が追加のスペースオーバーヘッドよりも小さくなり、最終的には元のデータストレージサイズよりもはるかに大きなストレージスペースのデータサイズにつながります。
整数配列
と圧縮リスト##に基づいて、List、Hash、Sorted Set#を使用して実装できます。 、整数配列と圧縮リストは、メモリ上に連続したアドレスを持つ空間を確保し、その空間にセット内の要素を1つずつ配置するため、非常に便利です。コンパクトであり、要素を接続するために追加のポインタを使用する必要がないため、追加のポインタによって引き起こされるスペースのオーバーヘッドが回避されます。さらに、コレクション型を使用する場合、1 つのキーがコレクションのデータに対応し、より多くのデータを保存できますが、使用される dictEntry は 1 つだけであるため、メモリが節約されます。コレクションタイプの統計モード
Redis
一般的なコレクションタイプの統計モードには次のものがあります:

集計統計 (交差、差分セット、和集合統計): 複数のセットで集計計算を実行する場合、Set;

統計の並べ替え (セットタイプが必要です)要素の順序は保持できます): Redis の List と Sorted Set は順序付けられたコレクションであり、List は要素に従って入力されます List は順序でソートされ、Sorted Set は要素の重みに従ってソートできます;

バイナリ状態統計 (セット要素の値は0 と 1 のみ) : Bitmap 自体は、基盤となるデータ構造として String 型を使用して実装された統計バイナリ状態データ型です。ビットマップは、BITOP のビットごとの AND、OR、および XOR の後に使用されます。 BITCOUNT は 1 の数をカウントします。

カーディナリティ統計 (セット内の固有の要素の数をカウントする): HyperLogLog は、カーディナリティをカウントするために使用されるデータ収集タイプです。統計結果には、一定の誤差があります。標準エラー率は次のとおりです。 0.81%。正確な統計結果が必要な場合は、Set または Hash タイプを使用します。

#Set タイプ。# などの統計的なユーザー/友達/フォロー/ファン/関心のある人々のコレクション集計操作に適しています。
## 毎日のモバイル APP の新規ユーザー数の統計

2 人のユーザーの共通の友人

Redis
中リスト と Sorted Set は順序付きセットで、
最新のコメントリスト

Ranking
などのセット要素の並べ替え要件を処理するために使用されます。

ビットマップ
バイナリステータス統計は、大量のデータを含む統計に適しており、次のようなバイナリステータスで表すことができます。クロックイン、その日のユーザーチェックイン数User Weekly Active
User Online Status

HyperLogLog
は、カーディナリティをカウントし、コレクション内の非繰り返し要素をカウントするために使用されるデータコレクションタイプ数値 (例:

は、Web ページの UV をカウントします。カウントできるのは、1 日にユーザーが複数回訪問した場合のみ)
シングルポイントクエリ/範囲クエリをサポート

RedisList
および
Sorted Set は範囲クエリをサポートする順序付きコレクションですが、Hash は 範囲クエリをサポートしない特別な使用シナリオです
メッセージキュー 、メッセージキューの実装として Redis
を使用、メッセージの基本要件
メッセージの順序を保持する、重複するメッセージ および を処理するメッセージの信頼性を確保する 、ソリューションは次のとおりです。 List のメッセージキューソリューションに基づく #ストリームベースのメッセージキューソリューション

データ型データ構造

文字列 SDS (単純な動的文字列)

リスト二重リンクリスト
圧縮リスト

#リストに基づくStrems に基づく##メッセージ順序の保存#LPUSH/RPOP を使用するXADD/XREAD を使用する使用 XREAD ブロックプロデューサはグローバル一意の ID を実装しますメッセージの信頼性使用使用保留メッセージを自動的に保持するリストロケーションベースの LBS サービスは、特定の RedisGEO概要

##読み取りのブロック BRPOP
重複メッセージ処理 #ストリームは自動的にグローバルに一意の ID を生成します

BRPOPLPUSH
#適用可能なシナリオ##メッセージの総量は少ないです##メッセージの総量はサイズが大きく、データはコンシューマグループの形式で読み取る必要があります
GEO## を使用して実装されていますの # データ型は地理的な位置情報を経度と緯度の形式で記録でき、LBS で広く使用されています。たとえば、タクシー配車ソフトウェアが位置に基づいてサービスを提供する方法などです。

Redis は、メモリベースのデータ操作と HashHash As の使用により非常に高速です。インデックスに基づいてテーブルは非常に効率的かつ高速であり、基になるデータが多様化しているため、多くのシナリオに適用できます。さまざまなシナリオで適切なデータ型を選択すると、クエリのパフォーマンスを向上させることができます。 プログラミング関連の知識について詳しくは、プログラミングビデオ
をご覧ください。！

以上がRedisのデータ構造を詳しく解説の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事はsegmentfaultで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

Redis：その目的と主要なアプリケーションを発表しますMay 03, 2025 am 12:11 AM

Redisisanopen-Source、In-MemoryDatastructurestoreStoreSadatabase、Cache、AndmessageBroker、ExcellingInspeedandversatility.ItisisWidely-susederCaching、Real-Timeanalytics、Session Management、AndleaderboardsdueTotutsuptorututrututrututruturturturturturturesturesaddataacys

Redis：キー価値データストアのガイドMay 02, 2025 am 12:10 AM

Redisは、データベース、キャッシュ、メッセージブローカーとして使用されるオープンソースメモリデータ構造ストレージであり、高速応答と高い並行性が必要なシナリオに適しています。 1.Redisはメモリを使用してデータを保存し、マイクロ秒の読み取り速度と書き込み速度を提供します。 2.文字列、リスト、コレクションなどのさまざまなデータ構造をサポートします。3。Redisは、RDBおよびAOFメカニズムを介してデータの持続性を実現します。 4.シングルスレッドモデルと多重化テクノロジーを使用して、リクエストを効率的に処理します。 5.パフォーマンス最適化戦略には、LRUアルゴリズムとクラスターモードが含まれます。

Redis：キャッシュ、セッション管理などMay 01, 2025 am 12:03 AM

Redisの関数には、主にキャッシュ、セッション管理、その他の機能が含まれます。1）キャッシュ関数はメモリを介してデータを保存して読み取り速度を向上させ、eコマースWebサイトなどの高周波アクセスシナリオに適しています。 2）セッション管理関数は、分散システムでセッションデータを共有し、有効期限のあるメカニズムを通じて自動的にクレンジングします。 3）リアルタイムメッセージプッシュおよびマルチスレッドシステムおよびその他のシナリオに適した、パブリッシュサブスクライブモード、分散ロック、カウンターなどのその他の機能。

Redis：そのコア機能と利点の調査Apr 30, 2025 am 12:22 AM

Redisのコア関数には、メモリストレージと持続性メカニズムが含まれます。 1）メモリストレージは、高性能アプリケーションに適した非常に高速な読み取り速度と書き込み速度を提供します。 2）永続性は、RDBとAOFによってデータが失われないことを保証し、選択はアプリケーションのニーズに基づいています。

Redisのサーバー側操作：提供するものApr 29, 2025 am 12:21 AM

redis'sserver-sideoperations offferidions and forexuctingcomplexoperationsontheserver.1）機能を調整することで、javascript、orredis'sscriptinglanguage、infulancingscalabilityandmantenmention

Redis：データベースまたはサーバー？役割を分かりやすいApr 28, 2025 am 12:06 AM

redisisbothadatabaseandaserver.1）asadatabase、itusesin memorystorage forfastaccess、理想的なforreal-timeapplicationsandcaching.2）asaserver、itupportspub/submessagingandaging andluascriptingforreal-communicationandserver-sideoperation。

Redis：NOSQLアプローチの利点Apr 27, 2025 am 12:09 AM

Redisは、高性能と柔軟性を提供するNOSQLデータベースです。 1）大規模データと高い並行性の処理に適したキー価値ペアを介してデータを保存します。 2）メモリストレージとシングルスレッドモデルは、速い読み取りと書き込みと原子性を確保します。 3）RDBおよびAOFメカニズムを使用してデータを持続し、高可用性とスケールアウトをサポートします。

Redis：そのアーキテクチャと目的を理解するApr 26, 2025 am 12:11 AM

Redisは、主にデータベース、キャッシュ、メッセージブローカーとして使用されるメモリデータ構造ストレージシステムです。そのコア機能には、シングルスレッドモデル、I/O多重化、持続メカニズム、複製、クラスタリング機能が含まれます。 Redisは、キャッシュ、セッションストレージ、メッセージキューのための実際のアプリケーションで一般的に使用されます。適切なデータ構造を選択し、パイプラインとトランザクションを使用し、監視とチューニングを使用することにより、パフォーマンスを大幅に改善できます。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

Dreamweaver Mac版

ビジュアル Web 開発ツール

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

ホットトピック

1652

1412

1303

1250

1224