redis學習筆記-string原理-Redis-PHP中文網

首頁

資料庫

Redis

redis 學習筆記-string 原理

Golang菜鸟

Aug 08, 2023 pm 04:19 PM

redis

字串是Redis 最基本的資料類型，不僅所有key 都是字串類型，其它幾種資料類型構成的元素也是字符串。注意字串的長度不能超過 512 M。

首先是誰規定不能超過 512 M？或為什麼不能超過 512 M？

// 源码定义（检查字符串长度）
static int checkStringLength(redisClient *c, long long size) {
    if (size > 512*1024*1024) {
        addReplyError(c,"string exceeds maximum allowed size (512MB)");
        return REDIS_ERR;
    }
    return REDIS_OK;
}

由原始碼檢查固定不能超過 512 M。

來看redis 字串的結構體：

struct sdshdr{
    // 记录 buf 数组中已使用字节的数量
    // 等于 SDS 所保存字符串的长度
    int len;
    // 记录 buf 数组中未使用字节的数量
    int free;
    // 字节数组，用于保存字符串
    char buf[];
}

由此可以直接看出，int 為32位，那麼最大應該可以支援4G 的字串，但是實際情況並非如此。

為了找出為什麼不能超過512 M，發現了一個官方的答案：

redis 學習筆記-string 原理

# #然後我才發現，我看過的redis 資料已經過時了！

redis 學習筆記-string 原理

看看，還有人也中招了。這個討論的版本都是3.2 之前的了。
#

话不多说，继续学习 redis5.0 版本的资料。不过之前学习了的也没事，我们可以一起来看下 redis 的字符串是怎么优化的。

用如下结构来存储长度小于32的短字符串：

struct __attribute__((__packed__)) sdshdr5 {
        unsigned char flags; /* 低3位存储类型，高5位存储长度*/
        char buf[]; /* 柔性数组，存放实际内容*/
}

sdshdr5 结构中，flags占1个字节，其低3位（bit）表示type，高5位（bit）表示长度，能表示的长度区间为0～31（25-1）, flags后面就是字符串的内容。

而对于长度大于31的字符串，这个结构就不够用了，所以对于不同长度的字符串，有不同的处理方式：

#define SDS_TYPE_5  0
#define SDS_TYPE_8  1
#define SDS_TYPE_16 2
#define SDS_TYPE_32 3
#define SDS_TYPE_64 4

struct __attribute__ ((__packed__)) sdshdr8 {
    uint8_t len; /* used */
    uint8_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr16 {
    uint16_t len; /* used */
    uint16_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr32 {
    uint32_t len; /* used */
    uint32_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr64 {
    uint64_t len; /* used */
    uint64_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};

可以看到，这4种结构的成员变量类似，唯一的区别是len和alloc的类型不同。

结构体中4个字段的具体含义分别如下:

1）len：表示buf中已占用字节数。

2）alloc：表示buf中已分配字节数，不同于free，记录的是为buf分配的总长度。

3）flags：标识当前结构体的类型，低3位用作标识位，高5位预留。

4）buf：柔性數組，真正儲存字串的資料空間。

建立字串的過程：

Redis透過sdsnewlen函數建立SDS。在函數中會根據字串長度選擇適當的類型，初始化對應的統計值後，傳回指向字串內容的指針，根據字串長度選擇不同的類型。

對於sdshdr5類型，在建立空字串時會強制轉換為sdshdr8。原因可能是創建空字串後，其內容可能會頻繁更新而引發擴容，故創建時直接創建為sdshdr8。

拼接字串：

sdscatsds是暴露給上層的方法，其最終呼叫的是sdscatlen。由於其中可能涉及SDS的擴容，sdscatlen中調用sdsMakeRoomFor對帶拼接的字符串s容量做檢查，若無須擴容則直接返回s；若需要擴容，則返回擴容好的新字符串s。函數中的len、curlen等長度值是不含結束符的，而拼接時用memcpy將兩個字串拼接在一起，指定了相關長度，故該過程保證了二進制安全。最後需要加上結束符號。

字串擴容

#若sds中剩餘空閒長度avail大於新增內容的長度addlen，直接在柔性數組buf末端追加即可，無須擴容。
若sds中剩餘空閒長度avail小於或等於新增內容的長度addlen，則分情況討論：新增後總長度len addlen1MB的，以新長度加上1MB擴容。
最後根據新長度重新選取儲存類型，並指派空間。此處若無須更改類型，透過realloc擴大柔性數組即可；否則需要重新開闢內存，並將原字串的buf內容移至新位置。

字串大致上就這些內容了。

在5.0 的版本中，沒有什麼字串512M 的限制，對於字串的處理方式，根據不同型別處理方式不同，更加節約記憶體；

以上是redis 學習筆記-string 原理的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：Golang菜鸟。如有侵權，請聯絡admin@php.cn刪除

REDIS：探索其數據模型和結構Apr 16, 2025 am 12:09 AM

Redis的數據模型和結構包括五種主要類型：1.字符串（String）：用於存儲文本或二進制數據，支持原子操作。 2.列表（List）：有序元素集合，適合隊列和堆棧。 3.集合（Set）：無序唯一元素集合，支持集合運算。 4.有序集合（SortedSet）：帶分數的唯一元素集合，適用於排行榜。 5.哈希表（Hash）：鍵值對集合，適合存儲對象。

REDIS：對其數據庫方法進行分類Apr 15, 2025 am 12:06 AM

Redis的數據庫方法包括內存數據庫和鍵值存儲。 1）Redis將數據存儲在內存中，讀寫速度快。 2）它使用鍵值對存儲數據，支持複雜數據結構，如列表、集合、哈希表和有序集合，適用於緩存和NoSQL數據庫。

為什麼要使用redis？利益和優勢Apr 14, 2025 am 12:07 AM

Redis是一個強大的數據庫解決方案，因為它提供了極速性能、豐富的數據結構、高可用性和擴展性、持久化能力以及廣泛的生態系統支持。 1）極速性能：Redis的數據存儲在內存中，讀寫速度極快，適合高並發和低延遲應用。 2）豐富的數據結構：支持多種數據類型，如列表、集合等，適用於多種場景。 3）高可用性和擴展性：支持主從復制和集群模式，實現高可用性和水平擴展。 4）持久化和數據安全：通過RDB和AOF兩種方式實現數據持久化，確保數據的完整性和可靠性。 5）廣泛的生態系統和社區支持：擁有龐大的生態系統和活躍社區，