실제 개발에서는 Redis
를 자주 사용하게 되는데, 사용 시 데이터 타입을 어떻게 올바르게 선택해야 할까요? 어떤 데이터 유형이 어떤 시나리오에 적합한지 그리고 인터뷰에서 면접관은 Redis 데이터 구조에 대한 질문을 자주 받습니다. Redis
使用会频繁,那么在使用过程中我们该如何正确抉择数据类型呢?哪些场景下适用哪些数据类型。而且在面试中也很常会被面试官问到Redis数据结构方面的问题:
当我们分析理解了Redis
数据结构,可以为了我们在使用Redis
的时候,正确抉择数据类型使用,提升系统性能。【相关推荐:Redis视频教程】
Redis
底层数据结构Redis
是一个内存键值key-value
数据库,且键值对数据保存在内存中,因此Redis
基于内存的数据操作,其效率高,速度快;
其中,Key
是String
类型,Redis
支持的 value
类型包括了 String
、List
、 Hash
、 Set
、 Sorted Set
、BitMap
等。Redis
能够之所以能够广泛地适用众多的业务场景,基于其多样化类型的value
。
而Redis
的Value
的数据类型是基于为Redis
自定义的对象系统redisObject
实现的,
typedef struct redisObject{ //类型 unsigned type:4; //编码 unsigned encoding:4; //指向底层实现数据结构的指针 void *ptr; ….. }
redisObject
除了记录实际数据,还需要额外的内存空间记录数据长度、空间使用等元数据信息,其中包含了 8 字节的元数据和一个 8 字节指针,指针指向具体数据类型的实际数据所在位置:
其中,指针指向的就是基于Redis
的底层数据结构存储数据的位置,Redis
的底层数据结构:SDS
,双向链表、跳表,哈希表,压缩列表、整数集合实现的。
那么Redis底层数据结构是怎么实现的呢?
我们先来看看Redis
比较简单的SDS
,双向链表,整数集合。
SDS
、双向链表和整数集合SDS
,使用len
字段记录已使用的字节数,将获取字符串长度复杂度降低为O(1),而且SDS
是惰性释放空间的,你free
了空间,系统把数据记录下来下次想用时候可直接使用。不用新申请空间。
整数集合,在内存中分配一块地址连续的空间,数据元素会挨着存放,不需要额外指针带来空间开销,其特点为内存紧凑节省内存空间,查询复杂度为O(1)效率高,其他操作复杂度为O(N);
双向链表, 在内存上可以为非连续、非顺序空间,通过额外的指针开销前驱/后驱指针串联元素之间的顺序。
其特点为节插入/更新数据复杂度为O(1)效率高,查询复杂度为O(N);
Hash
哈希表哈希表,其实类似是一个数组,数组的每个元素称为一个哈希桶,每个哈希桶中保存了键值对数据,且哈希桶中的元素使用dictEntry
结构,
因此,哈希桶元素保存的并不是键值对值本身,而是指向具体值的指针,所以在保存每个键值对的时候会额外空间开销,至少有增加24个字节,特别是Value
为String
Redis
데이터 구조를 분석하고 이해하면 사용할 데이터 유형을 올바르게 선택할 수 있고 Redis
사용 시 시스템 성능을 향상시킬 수 있습니다. [관련 권장사항: 🎜Redis 동영상 튜토리얼] 🎜Redis
기본 데이터 구조Redis
는 메모리 키-값 키-값
데이터베이스와 키-값 쌍 데이터는 메모리에 저장되므로 Redis
메모리 기반 데이터 작업은 매우 효율적이고 빠릅니다. 🎜🎜그 중 Key
는 String
유형이고 Redis
는 를 지원합니다. value
유형에는 String
, List
, Hash
, Set
, Sorted Set
가 포함됩니다. code>, BitMap
등 Redis
는 다양한 유형의 가치
를 기반으로 다양한 비즈니스 시나리오에 널리 적용될 수 있습니다. 🎜🎜 Redis
의 Value
데이터 유형은 Redis에 맞게 사용자 정의된 객체 시스템 <code>redisObject
를 기반으로 합니다. code> >실제 데이터를 기록하는 것 외에도 🎜rrreee🎜redisObject
는 8바이트의 메타데이터와 8단어 섹션을 포함하는 데이터 길이 및 공간 사용량과 같은 메타데이터 정보를 기록하기 위해 추가 메모리 공간이 필요합니다. 포인터는 특정 데이터 유형의 실제 데이터 위치를 가리킵니다. 🎜🎜🎜🎜그 중 포인터는 Redis 코드>의 기본 데이터 구조는 데이터의 위치를 저장합니다. <code>Redis
의 기본 데이터 구조는 SDS
, 이중 연결 목록, 점프 목록, 해시 테이블입니다. , 압축 목록 및 정수 컬렉션. 🎜🎜그렇다면 Redis의 기본 데이터 구조는 어떻게 구현됩니까? 🎜Redis
의 더 간단한 SDS
를 살펴보겠습니다. 양방향 연결 목록, 정수 집합. 🎜SDS
, 이중 연결 목록 및 정수 집합SDS
, len
를 사용하여 기록됨 > 필드 사용된 바이트 수는 문자열 길이를 얻는 복잡성을 O(1)로 줄이고 SDS
는 지연 해제 공간이므로 해제합니다. 코드> 코드> 공간, 시스템은 데이터를 기록하고 다음에 사용할 때 직접 사용할 수 있습니다. 새로운 공간을 신청할 필요가 없습니다. <br><span class="img-wrap"><img class="lazy" src="https://img.php.cn/upload/article/000/000/024/a6bb77c337b840fb785407be5753fa62-2.png" alt="Redis의 데이터 구조에 대한 자세한 설명" title="Redis의 데이터 구조에 대한 자세한 설명"></span><br><strong>정수 컬렉션</strong>, 메모리에 연속된 주소가 있는 공간을 할당하면 데이터 요소가 서로 옆에 저장되므로 공간 오버헤드를 가져오기 위해 추가 포인터가 필요하지 않으며 그 특징은 메모리 컴팩트, 메모리 공간 절약, 쿼리 복잡도 O(1) 및 고효율, 기타 작업 복잡도 O(N);🎜🎜<strong>이중 연결 목록</strong>은 메모리 내에서 비연속적이고 비순차적인 공간일 수 있으며, 요소 간의 순서는 프런트엔드의 추가 포인터 오버헤드를 통해 직렬로 연결됩니다. /백엔드 포인터. 🎜🎜섹션 삽입/업데이트 데이터 복잡도가 O(1)이고 쿼리 복잡도가 O(N)인 것이 특징입니다. 🎜<h4>
<strong><code>해시
해시 테이블 🎜해시 테이블은 실제로 배열과 유사합니다. 배열의 각 요소를 해시 버킷이라고 합니다. 각 해시 버킷은 키-값 쌍 데이터를 저장하고 해시 버킷의 요소는 dictEntry를 사용합니다. 코드> 구조,값
이 문자열
인 경우 의 키-값 쌍에는 각 키-값 쌍에 추가로 24바이트의 공간이 필요합니다. 저장된 데이터의 양이 적고 추가 오버헤드가 데이터보다 큰 경우 공간 절약을 위해 데이터 구조를 변경하는 것을 고려해보세요. 🎜글로벌 해시 테이블의 전체 그림을 살펴보겠습니다.
해시 테이블 작업은 빠르지만 Redis
데이터가 커지면 잠재적인 위험이 나타납니다. Redis
数据变大后,就会出现一个潜在的风险:哈希表的冲突问题和 rehash
开销问题,这可以解释为什么哈希表操作变慢了?
当往哈希表中写入更多数据时,哈希冲突是不可避免的问题 , Redis 解决哈希冲突的方式,就是链式哈希,同一个哈希桶中的多个元素用一个链表来保存,它们之间依次用指针连接,如图所示:
当哈希冲突也会越来越多,这就会导致某些哈希冲突链过长,进而导致这个链上的元素查找耗时长,效率降低。
为了解决哈希冲突带了的链过长的问题,进行rehash
操作,增加现有的哈希桶数量,分散单桶元素数量。那么rehash
过程怎么样执行的呢?
Rehash
为了使rehash
操作更高效,使用两个全局哈希表:哈希表 1 和哈希表 2,具体如下:
但由于表1和表2在重新映射复制时数据大,如果一次性把哈希表 1 中的数据都迁移完,会造成 Redis
线程阻塞,无法服务其他请求。
为了避免这个问题,保证Redi
s能正常处理客户端请求,Redis
采用了渐进式 rehash
。
每处理一个请求时,从哈希表 1 中依次将索引位置上的所有 entries 拷贝到哈希表 2 中,把一次性大量拷贝的开销,分摊到了多次处理请求的过程中,避免了耗时操作,保证了数据的快速访问。
在理解完Hash
Hash 테이블 충돌 문제 및 rehash
오버헤드 문제
체인 해싱으로, 동일한 해시 버킷에 여러 해시가 연결되어 있습니다. 그림과 같이 포인터를 사용하여 차례로 연결됩니다.
해시 충돌로 인해 체인이 너무 길어지는 문제를 해결하기 위해
rehash
작업을 수행하여 기존 해시 버킷 수를 늘리고 단일 버킷에 요소 수를 분산시킵니다. . 그렇다면 rehash
프로세스는 어떻게 수행되나요? 재해시
재해시
작업을 보다 효율적으로 만들기 위해 두 개의 전역 해시 테이블, 즉 해시 테이블 1과 해시 테이블 2가 사용됩니다.
단, 재매핑 및 복사 중에 테이블 1과 테이블 2의 데이터가 크기 때문에 해시 테이블 1의 모든 데이터를 한 번만 실행하면 Redis
스레드가 차단되어 다른 요청을 처리할 수 없게 됩니다.
Redi
가 클라이언트 요청을 정상적으로 처리할 수 있도록 하기 위해 Redis
는 점진적 rehash
at 해시 해시 테이블 관련 지식 포인트를 이해한 후, 흔하지 않은 압축 목록과 스킵 테이블을 살펴보겠습니다. |
압축된 목록 및 건너뛰기 목록 |
---|---|
, 배열을 기준으로 압축된 목록에는 헤더에 zlbytes, zltail 및 zllen이라는 세 개의 필드가 있으며, 각각 목록의 길이, 오프셋을 나타냅니다. 목록의 끝과 목록의 길이. 압축된 목록에는 목록의 끝을 나타내는 zlend도 있습니다. | |
장점: | 컴팩트한 메모리는 메모리 공간을 절약합니다. 데이터 요소는 공간 오버헤드를 가져오고 위치를 찾는 데 필요한 추가 포인터 없이 서로 옆에 저장됩니다. 첫 번째 요소와 마지막 요소는 세 개의 헤더 필드의 길이를 통해 직접 찾을 수 있으며 복잡도는 O(1)입니다.|
는 연결된 목록을 기반으로 다단계 인덱스를 추가하여 아래 그림과 같이 인덱스 위치에서 여러 번의 점프를 통해 데이터의 신속한 위치 지정을 실현합니다. | 예를 들어 쿼리 33 |
특징: 데이터의 양이 많을 때 스킵 테이블의 검색 복잡도는 O(logN)입니다. | 요약하자면, 기본 데이터 구조의 시간 복잡도를 알 수 있습니다. |
데이터 구조 유형 |
Redis
의 사용자 정의 개체 시스템 유형은 Redis
의 Value
데이터 유형이고 Redis
의 데이터 유형입니다. code>는 기본 데이터 구조를 기반으로 구현됩니다. 데이터 유형은 무엇입니까? Redis
自定义的对象系统类型即为Redis
的Value
的数据类型,Redis
的数据类型是基于底层数据结构实现的,那数据类型有哪些呢?
String
、List
、Hash
、Sorted Set
、Set
문자열
, 목록
, 해시
, 정렬 Set
, Set
은 비교적 일반적인 유형이며 기본 데이터 구조와의 해당 관계는 다음과 같습니다. 위 내용은 Redis의 데이터 구조에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!