Maison  >  Article  >  base de données  >  Analyse approfondie des raisons pour lesquelles Redis est si rapide ?

Analyse approfondie des raisons pour lesquelles Redis est si rapide ?

青灯夜游
青灯夜游avant
2021-09-16 19:46:342605parcourir

Analyse approfondie des raisons pour lesquelles Redis est si rapide ?

Nous savons tous que Redis est très rapide et que son QPS peut atteindre 100 000 (requêtes par seconde). Pourquoi Redis est-il si rapide , cet article apprendra avec vous. [Recommandations associées : Tutoriel vidéo Redis]

Analyse approfondie des raisons pour lesquelles Redis est si rapide ?

Basé sur l'implémentation de la mémoire

Nous savons tous que la lecture et l'écriture de la mémoire sont beaucoup plus rapides que la lecture et l'écriture du disque. Redis est une base de données implémentée basée sur le stockage en mémoire. Par rapport aux bases de données où les données sont stockées sur disque, la consommation d'E/S disque est éliminée. Les bases de données sur disque telles que MySQL doivent créer des index pour accélérer l'efficacité des requêtes, tandis que les données Redis sont stockées en mémoire et fonctionnent directement sur la mémoire, ce qui est donc très rapide.

Analyse approfondie des raisons pour lesquelles Redis est si rapide ?

Structure de données efficace

Nous savons que afin d'améliorer l'efficacité, l'index MySQL choisit la structure de données arborescente B+. En fait, une structure de données raisonnable peut rendre votre application/programme plus rapide. Jetons d'abord un coup d'œil à la structure des données et au schéma de codage interne de Redis :

Analyse approfondie des raisons pour lesquelles Redis est si rapide ?

Chaîne dynamique simple SDS

Analyse approfondie des raisons pour lesquelles Redis est si rapide ?

struct sdshdr { //SDS简单动态字符串
    int len;    //记录buf中已使用的空间
    int free;   // buf中空闲空间长度
    char buf[]; //存储的实际内容
}

Traitement de la longueur de la chaîne

En langage C, pour que le Petit garçon reprenne snailsLa longueur de cette chaîne doit être parcourue depuis le début et la complexité est O(n); Dans Redis, il existe déjà un champ <code>捡田螺的小男孩这个字符串的长度,需要从头开始遍历,复杂度为O(n); 在Redis中, 已经有一个len字段记录当前字符串的长度啦,直接获取即可,时间复杂度为O(1)。

减少内存重新分配的次数

在C语言中,修改一个字符串,需要重新分配内存,修改越频繁,内存分配就越频繁,而分配内存是会消耗性能的。而在Redis中,SDS提供了两种优化策略:空间预分配和惰性空间释放。

空间预分配

当SDS简单动态字符串修改和空间扩充时,除了分配必需的内存空间,还会额外分配未使用的空间。分配规则是酱紫的:

  • SDS修改后,len的长度小于1M,那么将额外分配与len相同长度的未使用空间。比如len=100,重新分配后,buf 的实际长度会变为100(已使用空间)+100(额外空间)+1(空字符)=201。
  • SDS修改后, len长度大于1M,那么程序将分配1M的未使用空间。

惰性空间释放

当SDS缩短时,不是回收多余的内存空间,而是用free记录下多余的空间。后续再有修改操作,直接使用free中的空间,减少内存分配。

哈希

Redis 作为一个K-V的内存数据库,它使用用一张全局的哈希来保存所有的键值对。这张哈希表,有多个哈希桶组成,哈希桶中的entry元素保存了*key*value指针,其中*key指向了实际的键,*valuelen

qui enregistre la longueur de la chaîne actuelle. Vous pouvez l'obtenir directement, et la complexité temporelle est O(1).

Réduire le nombre de réallocations de mémoireAnalyse approfondie des raisons pour lesquelles Redis est si rapide ?En langage C, la modification d'une chaîne nécessite une réallocation de mémoire. Plus la modification est fréquente, plus l'allocation de mémoire est fréquente et l'allocation de mémoire est importante.

consommer de la performance. Dans Redis, SDS propose deux stratégies d'optimisation : la pré-allocation d'espace et la libération d'espace différée. Pré-allocation d'espace

Lorsque SDS modifie simplement la chaîne dynamique et agrandit l'espace, en plus de l'allocation de l'espace mémoire nécessaire, de l'espace supplémentaire inutilisé sera alloué. Les règles d'allocation sont violettes :

  • Une fois le SDS modifié, la longueur de len est inférieure à 1 M, puis un espace supplémentaire inutilisé de la même longueur que len sera alloué. Par exemple, len=100, après réallocation, la longueur réelle de buf deviendra 100 (espace utilisé) + 100 (espace supplémentaire) + 1 (caractère nul) = 201.
  • Une fois le SDS modifié, la longueur de la longueur est supérieure à 1 M, le programme allouera alors 1 M d'espace inutilisé.

Libération d'espace paresseuse

Lorsque SDS est raccourci, au lieu de récupérer l'espace mémoire excédentaire, free est utilisé pour enregistrer l'espace excédentaire. S'il y a des opérations de modification ultérieures, l'espace libre sera utilisé directement pour réduire l'allocation mémoire.

HashRedis est une base de données K-V en mémoire, qui utilise un hachage global pour enregistrer toutes les paires clé-valeur. Cette table de hachage est composée de plusieurs compartiments de hachage. Les éléments d'entrée dans les compartiments de hachage stockent les pointeurs *key et *value, parmi lesquels *key . pointe vers la clé réelle et *value pointe vers la valeur réelle.

Analyse approfondie des raisons pour lesquelles Redis est si rapide ?

La vitesse de recherche des tables de hachage est très rapide, un peu similaire à

HashMap

en Java, ce qui nous permet de trouver rapidement des paires clé-valeur dans la complexité temporelle O(1). Tout d'abord, calculez la valeur de hachage via la clé, recherchez l'emplacement du compartiment de hachage correspondant, puis localisez l'entrée et recherchez les données correspondantes dans l'entrée.

🎜Certains amis peuvent avoir des questions : lorsque vous écrivez une grande quantité de données dans la table de hachage, ne rencontrerez-vous pas le problème du 🎜conflit de hachage🎜 et l'efficacité diminuera. 🎜🎜🎜🎜Conflit de hachage : 🎜 La même valeur de hachage est calculée via différentes clés, ce qui entraîne le fait de tomber dans le même seau de hachage. 🎜🎜🎜Afin de résoudre les conflits de hachage, Redis utilise 🎜Chain Hash🎜. Le hachage en chaîne signifie que plusieurs éléments du même compartiment de hachage sont stockés dans une liste chaînée et qu'ils sont connectés tour à tour à l'aide de pointeurs. 🎜🎜🎜🎜🎜Certains amis peuvent encore avoir des questions : les éléments de la chaîne de conflits de hachage ne peuvent être recherchés qu'un par un via des pointeurs puis exploités. Lorsqu'une grande quantité de données est insérée dans la table de hachage, plus il y aura de conflits, plus la liste chaînée des conflits sera longue et l'efficacité des requêtes sera réduite. 🎜🎜Afin de maintenir l'efficacité, Redis effectuera des 🎜opérations de rehash🎜 sur la table de hachage, ce qui signifie ajouter des compartiments de hachage et réduire les conflits. Afin de rendre le rehachage plus efficace, Redis utilise également deux tables de hachage globales par défaut, une pour l'utilisation actuelle, appelée table de hachage principale, et une pour l'expansion, appelée table de hachage de sauvegarde. 🎜

跳跃表

跳跃表是Redis特有的数据结构,它其实就是在链表的基础上,增加多级索引,以提高查找效率。跳跃表的简单原理图如下:

Analyse approfondie des raisons pour lesquelles Redis est si rapide ?

  • 每一层都有一条有序的链表,最底层的链表包含了所有的元素。
  • 跳跃表支持平均 O(logN),最坏 O(N)复杂度的节点查找,还可以通过顺序性操作批量处理节点。

压缩列表ziplist

压缩列表ziplist是列表键和字典键的的底层实现之一。它是由一系列特殊编码的内存块构成的列表, 一个ziplist可以包含多个entry, 每个entry可以保存一个长度受限的字符数组或者整数,如下:

Analyse approfondie des raisons pour lesquelles Redis est si rapide ?

  • zlbytes :记录整个压缩列表占用的内存字节数
  • zltail: 尾节点至起始节点的偏移量
  • zllen : 记录整个压缩列表包含的节点数量
  • entryX: 压缩列表包含的各个节点
  • zlend : 特殊值0xFF(十进制255),用于标记压缩列表末端

由于内存是连续分配的,所以遍历速度很快。。

合理的数据编码

Redis支持多种数据基本类型,每种基本类型对应不同的数据结构,每种数据结构对应不一样的编码。为了提高性能,Redis设计者总结出,数据结构最适合的编码搭配。

Redis是使用对象(redisObject)来表示数据库中的键值,当我们在 Redis 中创建一个键值对时,至少创建两个对象,一个对象是用做键值对的键对象,另一个是键值对的值对象。

//关注公众号:捡田螺的小男孩
typedef struct redisObject{
    //类型
   unsigned type:4;
   //编码
   unsigned encoding:4;
   //指向底层数据结构的指针
   void *ptr;
    //...
 }robj;

redisObject中,type 对应的是对象类型,包含String对象、List对象、Hash对象、Set对象、zset对象。encoding 对应的是编码。

  • String:如果存储数字的话,是用int类型的编码;如果存储非数字,小于等于39字节的字符串,是embstr;大于39个字节,则是raw编码。
  • List:如果列表的元素个数小于512个,列表每个元素的值都小于64字节(默认),使用ziplist编码,否则使用linkedlist编码
  • Hash:哈希类型元素个数小于512个,所有值小于64字节的话,使用ziplist编码,否则使用hashtable编码。
  • Set:如果集合中的元素都是整数且元素个数小于512个,使用intset编码,否则使用hashtable编码。
  • Zset:当有序集合的元素个数小于128个,每个元素的值小于64字节时,使用ziplist编码,否则使用skiplist(跳跃表)编码

合理的线程模型

单线程模型:避免了上下文切换

Redis是单线程的,其实是指Redis的网络IO和键值对读写是由一个线程来完成的。但Redis的其他功能,比如持久化、异步删除、集群数据同步等等,实际是由额外的线程执行的。

Redis的单线程模型,避免了CPU不必要的上下文切换竞争锁的消耗。也正因为是单线程,如果某个命令执行过长(如hgetall命令),会造成阻塞。Redis是面向快速执行场景的内存数据库,所以要慎用如lrange和smembers、hgetall等命令。

什么是上下文切换?举个粟子:

  • 比如你在看一本英文小说,你看到某一页,发现有个单词不会读,你加了个书签,然后去查字典。查完字典后,你回来从书签那里继续开始读,这个流程就很舒畅。
  • 如果你一个人读这本书,肯定没啥问题。但是如果你去查字典的时候,别的小伙伴翻了一下你的书,然后溜了。你再回来看的时候,发现书不是你看的那一页了,你得花时间找到你的那一页。
  • 一本书,你一个人怎么看怎么打标签都没事,但是人多了翻来翻去,这本书各种标记就很乱了。可能这个解释很粗糙,但是道理应该是一样的。

Analyse approfondie des raisons pour lesquelles Redis est si rapide ?

I/O 多路复用

什么是I/O多路复用?

  • E/S : E/S réseau
  • Multicanal : plusieurs connexions réseau
  • Réutilisation : réutilisez le même fil.
  • Le multiplexage IO est en fait un modèle IO synchrone, qui implémente un thread capable de surveiller plusieurs descripteurs de fichiers ; une fois qu'un descripteur de fichier est prêt, il peut demander à l'application d'effectuer les opérations de lecture et d'écriture correspondantes sans descripteur de fichier. Lorsqu'il est prêt, le multiplexage IO est en fait un modèle IO synchrone, qui implémente un thread capable de surveiller plusieurs descripteurs de fichiers ; une fois qu'un descripteur de fichier est prêt, il peut demander à l'application d'effectuer les opérations de lecture et d'écriture correspondantes sans descripteur de fichier. l'application sera bloquée et le CPU sera remis.

Analyse approfondie des raisons pour lesquelles Redis est si rapide ?

La technologie de multiplexage d'E/S multiples permet à un seul thread de gérer efficacement plusieurs demandes de connexion, et Redis utilise epoll comme implémentation de la technologie de multiplexage d'E/S. Et le propre modèle de traitement des événements de Redis convertit les connexions, les lectures, les écritures et les fermetures dans epoll en événements, sans perdre trop de temps en E/S réseau.

Mécanisme de mémoire virtuelle

Redis construit directement le mécanisme de la VM par lui-même. Il n'appellera pas les fonctions système comme les systèmes ordinaires, ce qui fera perdre un certain temps en déplacements et en requêtes.

Quel est le mécanisme de mémoire virtuelle de Redis ?

Le mécanisme de mémoire virtuelle échange temporairement les données rarement consultées (données froides) de la mémoire vers le disque, libérant ainsi un espace mémoire précieux pour d'autres données auxquelles il faut accéder (données chaudes). La fonction VM peut réaliser la séparation des données chaudes et froides, de sorte que les données chaudes soient toujours dans la mémoire et que les données froides soient enregistrées sur le disque. Cela peut éviter le problème de vitesse d'accès lente causée par une mémoire insuffisante.

Pour plus de connaissances sur la programmation, veuillez visiter : Vidéo de programmation ! !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer