Maison >base de données >Redis >Compréhension approfondie du principe de synchronisation de cohérence des données de l'architecture maître-esclave dans Redis
Cet article vous présentera le principe de synchronisation de cohérence des données dans l'architecture maître-esclave de Redis. J'espère qu'il vous sera utile !
La haute disponibilité a deux significations : l'une est d'éviter autant que possible la perte de données et l'autre est de fournir des services autant que possible. AOF et RDB garantissent que la persistance des données n'est pas perdue autant que possible, tandis que la réplication maître-esclave consiste à ajouter des copies et à enregistrer une donnée sur plusieurs instances. Même si une instance tombe en panne, d’autres instances peuvent toujours fournir des services.
Cet article vous présente principalement l'architecture de réplication maître-esclave, l'une des solutions technologiques à haute disponibilité de Redis.
Cet article est hardcore. Il est recommandé de le récupérer et de le savourer lentement. Je pense que les lecteurs et amis auront une amélioration qualitative. S'il y a des erreurs, merci de les corriger, merci. Suivez "Ma Ge Byte" et définissez "star" pour recevoir des articles de haute qualité dans les plus brefs délais. Merci aux lecteurs pour votre soutien.Points de connaissances de base
Message d'ouvertureQuestion = opportunité. Lorsque vous rencontrez des problèmes, vous êtes réellement heureux intérieurement. Des problèmes plus importants signifient de plus grandes opportunités. Tout a un prix, il doit y avoir des gains et des pertes, et il doit y avoir des gains et des pertes, donc nous n'avons pas à nous soucier de beaucoup de choses. Il nous suffit de déterminer ce que nous voulons faire et à quel prix nous sommes. prêt à payer pour cela, et ensuite nous allons de l'avant et le faisons !1. Présentation de la réplication maître-esclave
65 Brother : Avec RDB et AOF, vous n'avez plus peur des pertes de données dues aux temps d'arrêt, mais comment atteindre une haute disponibilité lorsque l'instance Redis tombe en panne ?Puisqu'une machine est en panne et ne peut pas fournir de service, qu'en est-il des autres machines ? Est-ce que cela peut être résolu ? Redis fournit un mode maître-esclave, qui copie une copie redondante des données sur d'autres serveurs Redis via la réplication maître-esclave. Le premier est appelé nœud maître (maître) et le second est appelé nœud esclave (esclave) ; la réplication des données est unidirectionnelle et ne peut se faire que du nœud maître vers le nœud esclave. Par défaut, chaque serveur Redis est un nœud maître ; et un nœud maître peut avoir plusieurs nœuds esclaves (ou aucun nœud esclave), mais un nœud esclave ne peut avoir qu'un seul nœud maître.
65 Brother : Comment assurer la cohérence des données entre maître et esclave ?Afin d'assurer la cohérence des données des réplicas, l'architecture maître-esclave adopte une méthode de séparation lecture-écriture.
65 Brother : Pourquoi ; devrions-nous utiliser la séparation lecture-écriture ?Nous pouvons supposer que les bibliothèques maître et esclave peuvent exécuter des instructions d'écriture si les mêmes données sont modifiées plusieurs fois et que chaque modification est envoyée à une instance maître-esclave différente, les données de copie de l'instance seront incohérentes. Si pour assurer la cohérence des données, Redis a besoin de verrouiller et de coordonner la modification de plusieurs instances, Redis ne le fera naturellement pas !
65 Brother : La réplication maître-esclave a-t-elle d'autres fonctions ?
65 Brother : Comment construire une architecture de réplication maître-esclave ?
Il existe 3 façons d'activer la réplication maître-esclave sur le nœud esclave : Fichier de configurationLa relation entre la base de données maître et la base de données esclave peut être formée via la commande replicaof (slaveof était utilisée avant Redis 5.0).
réplique de <masterip> <masterport></masterport></masterip>
au fichier de configuration de le serveur esclave replicaof <masterip> <masterport></masterport></masterip>
启动命令
redis-server 启动命令后面加入 --replicaof <masterip> <masterport></masterport></masterip>
客户端命令
启动多个 Redis 实例后,直接通过客户端执行命令:replicaof <masterip> <masterport></masterport></masterip>
Commande de démarrage
--replicaof <masterip> <masterport></masterport></masterip>
Après le démarrage de plusieurs instances Redis, directement via le client Exécutez le : replicaof <masterip> <masterport></masterport></masterip>
, alors l'instance Redis devient un nœud esclave.
replicaof 172.16.88.1 6379复制代码🎜3. Principe de réplication maître-esclave🎜🎜Une fois que le modèle de bibliothèque maître-esclave adopte la séparation lecture-écriture, toutes les opérations d'écriture de données ne seront effectuées que sur la bibliothèque maître, sans coordonner trois instances. 🎜🎜Une fois que la base de données maître dispose des dernières données, elle sera synchronisée avec la base de données esclave, afin que les données des bases de données maître et esclave soient cohérentes. 🎜
65 Brother : Comment s'effectue la synchronisation de la base de données maître-esclave ? Les données de la base de données maître sont-elles transmises immédiatement à la base de données esclave ou sont-elles synchronisées par lots ? Comment synchroniser en fonctionnement normal ? Si le réseau entre les bibliothèques maître et esclave est déconnecté, les données resteront-elles cohérentes après la reconnexion ?
65 Frère, vous avez tellement de questions. La synchronisation est divisée en trois situations :
Le premier processus de copie de la bibliothèque maître-esclave peut être grossièrement divisé en 3 étapes : l'étape d'établissement de la connexion (c'est-à-dire l'étape de préparation), l'étape de synchronisation des données de la bibliothèque maître vers la bibliothèque esclave et l'étape d'envoyer de nouvelles commandes d'écriture lors de la synchronisation à la bibliothèque esclave
; Il suffit de regarder l'image ci-dessus pour avoir une vue d'ensemble, qui sera présentée en détail plus tard.
Établir la connexion
.
65 Frère : Comment la base de données esclave connaît-elle les informations principales de la base de données et établit-elle une connexion ?Après avoir configuré l'IP et le port du nœud maître dans la réplique de l'élément de configuration dans le fichier de configuration du nœud esclave, le nœud esclave saura à quel nœud maître il souhaite se connecter.
Le nœud esclave gère deux champs, masterhost et masterport, qui sont utilisés pour stocker les informations IP et de port du nœud maître.
La bibliothèque esclave exécute replicaof
et envoie la commande psync
, indiquant que la synchronisation des données doit être effectuée. Après avoir reçu la commande, la bibliothèque maître démarre la réplication selon les paramètres. . La commande contient deux paramètres :
de la bibliothèque principale et replicaof
并发送 psync
命令,表示要执行数据同步,主库收到命令后根据参数启动复制。命令包含了主库的 runID 和 复制进度 offset 两个参数。
主库收到 psync 命令后,会用 FULLRESYNC 响应命令带上两个参数:主库 runID 和主库目前的复制进度 offset,返回给从库。从库收到响应后,会记录下这两个参数。
FULLRESYNC 响应表示第一次复制采用的全量复制,也就是说,主库会把当前所有的数据都复制给从库。
第二阶段
master 执行 bgsave
命令生成 RDB 文件,并将文件发送给从库,同时主库为每一个 slave 开辟一块 replication buffer 缓冲区记录从生成 RDB 文件开始收到的所有写命令。
从库收到 RDB 文件后保存到磁盘,并清空当前数据库的数据,再加载 RDB 文件数据到内存中。
第三阶段
从节点加载 RDB 完成后,主节点将 replication buffer 缓冲区的数据发送到从节点,Slave 接收并执行,从节点同步至主节点相同的状态。
65 哥:主库将数据同步到从库过程中,可以正常接受请求么?
主库不会被阻塞,Redis 作为唯快不破的男人,怎么会动不动就阻塞呢。
在生成 RDB 文件之后的写操作并没有记录到刚刚的 RDB 文件中,为了保证主从库数据的一致性,所以主库会在内存中使用一个叫 replication buffer 记录 RDB 文件生成后的所有写操作。
65 哥:为啥从库收到 RDB 文件后要清空当前数据库?
因为从库在通过 replcaof
copy progress offset
: Chaque instance Redis générera automatiquement un identifiant d'identification unique lors de son démarrage. Pour la première réplication maître-esclave, le runID de la base de données principale n'est pas encore connu et le paramètre est défini sur "?" .runID
offset
: La première copie est définie sur -1, indiquant la première copie et enregistrant le décalage de progression de la copie. Une fois que la bibliothèque principale a reçu la commande pync, elle utiliseraFULLRESYNC pour répondre à la commande avec deux paramètres : le runID de la bibliothèque principale et le décalage de progression de copie actuel de la bibliothèque principale, et le renverra à l'esclave. bibliothèque
. Après réception de la réponse de la bibliothèque, ces deux paramètres seront enregistrés. La réponseFULLRESYNC indique que la première réplication adopte une réplication complète
, c'est-à-dire que la base de données maître copiera toutes les données actuelles dans la base de données esclave. 🎜bgsave
pour générer un fichier RDB et envoie le fichier à la bibliothèque esclave. En même temps, la 🎜bibliothèque principale🎜ouvre un tampon de réplication pour chaque esclave afin d'enregistrer toutes les commandes d'écriture reçues depuis la génération du fichier RDB. 🎜🎜Après avoir reçu le fichier RDB de la bibliothèque, enregistrez-le sur le disque, effacez les données de la base de données actuelle, puis chargez les données du fichier RDB dans la mémoire. 🎜replcaof
, pour éviter l'impact entre les données maître et esclave. 🎜🎜🎜Qu'est-ce que le tampon de réplication exactement ? 🎜🎜🎜Un tampon créé côté maître. Les données stockées sont toutes les opérations d'écriture de données maître dans les trois périodes suivantes. 🎜🎜1) L'opération d'écriture lorsque le maître exécute bgsave pour générer le RDB 🎜🎜2) L'opération d'écriture lorsque le maître envoie le rdb à l'esclave pour la transmission réseau 🎜🎜3) L'opération d'écriture lorsque l'esclave charge le rdb ; fichier et restaure les données dans la mémoire. 🎜🎜 Que Redis communique avec le client ou avec la bibliothèque esclave, Redis alloue un tampon mémoire pour l'interaction des données. Le client est un client, et la bibliothèque esclave est également un client. Une fois que chacun de nos clients se connecte à Redis, Redis le fera. Allouez un tampon client dédié et toutes les interactions de données sont effectuées via ce tampon. 🎜🎜Master écrit d'abord les données dans ce tampon, puis les envoie via le réseau, complétant ainsi l'interaction des données. 🎜不管是主从在增量同步还是全量同步时,master 会为其分配一个 buffer ,只不过这个 buffer 专门用来传播写命令到从库,保证主从数据一致,我们通常把它叫做 replication buffer。
replication buffer 太小会引发的问题:
replication buffer 由 client-output-buffer-limit slave 设置,当这个值太小会导致主从复制连接断开。
1)当 master-slave 复制连接断开,master 会释放连接相关的数据。replication buffer 中的数据也就丢失了,此时主从之间重新开始复制过程。
2)还有个更严重的问题,主从复制连接断开,导致主从上出现重新执行 bgsave 和 rdb 重传操作无限循环。
当主节点数据量较大,或者主从节点之间网络延迟较大时,可能导致该缓冲区的大小超过了限制,此时主节点会断开与从节点之间的连接;
这种情况可能引起全量复制 -> replication buffer 溢出导致连接中断 -> 重连 -> 全量复制 -> replication buffer 缓冲区溢出导致连接中断……的循环。
具体详情:[top redis headaches for devops – replication buffer] 因而推荐把 replication buffer 的 hard/soft limit 设置成 512M。
config set client-output-buffer-limit "slave 536870912 536870912 0"复制代码
65 哥:主从库复制为何不使用 AOF 呢?相比 RDB 来说,丢失的数据更少。
这个问题问的好,原因如下:
RDB 文件是二进制文件,网络传输 RDB 和写入磁盘的 IO 效率都要比 AOF 高。
从库进行数据恢复的时候,RDB 的恢复效率也要高于 AOF。
65 哥:主从库间的网络断了咋办?断开后要重新全量复制么?
在 Redis 2.8 之前,如果主从库在命令传播时出现了网络闪断,那么,从库就会和主库重新进行一次全量复制,开销非常大。
从 Redis 2.8 开始,网络断了之后,主从库会采用增量复制的方式继续同步。
增量复制:用于网络中断等情况后的复制,只将中断期间主节点执行的写命令发送给从节点,与全量复制相比更加高效。
repl_backlog_buffer
断开重连增量复制的实现奥秘就是 repl_backlog_buffer
缓冲区,不管在什么时候 master 都会将写指令操作记录在 repl_backlog_buffer
中,因为内存有限, repl_backlog_buffer
是一个定长的环形数组,如果数组内容满了,就会从头开始覆盖前面的内容。
master 使用 master_repl_offset
记录自己写到的位置偏移量,slave 则使用 slave_repl_offset
记录已经读取到的偏移量。
master 收到写操作,偏移量则会增加。从库持续执行同步的写指令后,在 repl_backlog_buffer
的已复制的偏移量 slave_repl_offset 也在不断增加。
正常情况下,这两个偏移量基本相等。在网络断连阶段,主库可能会收到新的写操作命令,所以 master_repl_offset
会大于 slave_repl_offset
。
当主从断开重连后,slave 会先发送 psync 命令给 master,同时将自己的 runID
,slave_repl_offset
发送给 master。
master 只需要把 master_repl_offset
与 slave_repl_offset
之间的命令同步给从库即可。
增量复制执行流程如下图:
65 哥:repl_backlog_buffer 太小的话从库还没读取到就被 Master 的新写操作覆盖了咋办?
我们要想办法避免这个情况,一旦被覆盖就会执行全量复制。我们可以调整 repl_backlog_size 这个参数用于控制缓冲区大小。计算公式:
repl_backlog_buffer = second * write_size_per_second复制代码
second:从服务器断开重连主服务器所需的平均时间;
write_size_per_second:master 平均每秒产生的命令数据量大小(写命令和数据大小总和);
例如,如果主服务器平均每秒产生 1 MB 的写数据,而从服务器断线之后平均要 5 秒才能重新连接上主服务器,那么复制积压缓冲区的大小就不能低于 5 MB。
为了安全起见,可以将复制积压缓冲区的大小设为2 * second * write_size_per_second
,这样可以保证绝大部分断线情况都能用部分重同步来处理。
65 哥:完成全量同步后,正常运行过程如何同步呢?
当主从库完成了全量复制,它们之间就会一直维护一个网络连接,主库会通过这个连接将后续陆续收到的命令操作再同步给从库,这个过程也称为基于长连接的命令传播,使用长连接的目的就是避免频繁建立连接导致的开销。
在命令传播阶段,除了发送写命令,主从节点还维持着心跳机制:PING 和 REPLCONF ACK。
每隔指定的时间,主节点会向从节点发送 PING 命令,这个 PING 命令的作用,主要是为了让从节点进行超时判断。
在命令传播阶段,从服务器默认会以每秒一次的频率,向主服务器发送命令:
REPLCONF ACK <replication_offset>复制代码</replication_offset>
其中 replication_offset 是从服务器当前的复制偏移量。发送 REPLCONF ACK 命令对于主从服务器有三个作用:
检测主从服务器的网络连接状态。
辅助实现 min-slaves 选项。
检测命令丢失, 从节点发送了自身的 slave_replication_offset,主节点会用自己的 master_replication_offset 对比,如果从节点数据缺失,主节点会从 repl_backlog_buffer
缓冲区中找到并推送缺失的数据。注意,offset 和 repl_backlog_buffer 缓冲区,不仅可以用于部分复制,也可以用于处理命令丢失等情形;区别在于前者是在断线重连后进行的,而后者是在主从节点没有断线的情况下进行的。
在 Redis 2.8 及以后,从节点可以发送 psync 命令请求同步数据,此时根据主从节点当前状态的不同,同步方式可能是全量复制或部分复制。本文以 Redis 2.8 及之后的版本为例。
关键就是 psync
的执行:
从节点根据当前状态,发送 psync
命令给 master:
replicaof
,则从节点发送 psync ? -1
,向主节点发送全量复制请求;replicaof
则发送 psync <runid> <offset></offset></runid>
, runID 是上次复制保存的主节点 runID,offset 是上次复制截至时从节点保存的复制偏移量。主节点根据接受到的psync
命令和当前服务器状态,决定执行全量复制还是部分复制:
slave_repl_offset
之后的数据在 repl_backlog_buffer
缓冲区中都存在,则回复 CONTINUE
,表示将进行部分复制,从节点等待主节点发送其缺少的数据即可;repl_backlog_buffer
缓冲区中 (在队列中被挤出了),则回复从节点 FULLRESYNC <runid> <offset></offset></runid>
,表示要进行全量复制,其中 runID 表示主节点当前的 runID,offset 表示主节点当前的 offset,从节点保存这两个值,以备使用。一个从库如果和主库断连时间过长,造成它在主库 repl_backlog_buffer
的 slave_repl_offset 位置上的数据已经被覆盖掉了,此时从库和主库间将进行全量复制。
总结下
每个从库会记录自己的 slave_repl_offset
,每个从库的复制进度也不一定相同。
在和主库重连进行恢复时,从库会通过 psync 命令把自己记录的 slave_repl_offset
发给主库,主库会根据从库各自的复制进度,来决定这个从库可以进行增量复制,还是全量复制。
replication buffer 和 repl_backlog
le tampon de réplication correspond à chaque esclave et est défini via config set client-output-buffer-limit slave
. config set client-output-buffer-limit slave
设置。
repl_backlog_buffer
是一个环形缓冲区,整个 master 进程中只会存在一个,所有的 slave 公用。repl_backlog 的大小通过 repl-backlog-size 参数设置,默认大小是 1M,其大小可以根据每秒产生的命令、(master 执行 rdb bgsave) +( master 发送 rdb 到 slave) + (slave load rdb 文件)时间之和来估算积压缓冲区的大小,repl-backlog-size 值不小于这两者的乘积。
总的来说,replication buffer
是主从库在进行全量复制时,主库上用于和从库连接的客户端的 buffer,而 repl_backlog_buffer
是为了支持从库增量复制,主库上用于持续保存写操作的一块专用 buffer。
repl_backlog_buffer
是一块专用 buffer,在 Redis 服务器启动后,开始一直接收写操作命令,这是所有从库共享的。主库和从库会各自记录自己的复制进度,所以,不同的从库在进行恢复时,会把自己的复制进度(slave_repl_offset
repl_backlog_buffer
est un tampon en anneau, il n'y en aura qu'un dans tout le processus maître, et il est commun à tous les esclaves. La taille de repl_backlog est définie par le paramètre repl-backlog-size. La taille par défaut est de 1 Mo. La taille peut être basée sur les commandes générées par seconde, (le maître exécute rdb bgsave) + (le maître envoie rdb à l'esclave) + (l'esclave. charger le fichier rdb) et pour estimer la taille du tampon de backlog, la valeur repl-backlog-size n'est pas inférieure au produit des deux.
tampon de réplication
est le tampon utilisé par le client sur la bibliothèque maître pour se connecter à la bibliothèque esclave lorsque la bibliothèque maître-esclave effectue une réplication complète, et repl_backlog_buffer code> est un tampon dédié sur la bibliothèque principale utilisé pour sauvegarder en continu les opérations d'écriture afin de prendre en charge la réplication incrémentielle à partir de la bibliothèque esclave.
repl_backlog_buffer
est un tampon dédié Une fois le serveur Redis démarré, il commence à recevoir des commandes d'opération d'écriture. Ceci est partagé par toutes les bibliothèques esclaves. La bibliothèque maître et la bibliothèque esclave enregistreront chacune leur propre progression de réplication. Par conséquent, lorsque différentes bibliothèques esclaves sont en cours de récupération, elles enverront leur propre progression de réplication (slave_repl_offset
) à la bibliothèque maître et à la bibliothèque maître. peut communiquer avec la bibliothèque principale. Il se synchronise indépendamment. Comme le montre la figure :
4.1 Le problème de la séparation lecture-écriture4. Problèmes d'application maître-esclave
Suppression régulière : Redis supprime les données expirées via des tâches planifiées.Suppression paresseuse : Lorsque le client interroge les données correspondantes, Redis détermine si les données ont expiré et les supprime si elles expirent.
65 Brother : Le client lira-t-il les données expirées en lisant les données du nœud esclave ?
À partir de Redis 3.2, lors de la lecture des données du nœud, déterminez d'abord si les données ont expiré. S'il expire, il ne sera pas restitué au client et les données seront supprimées. 4.2 Limite de taille de mémoire pour une seule machineSi la mémoire d'une seule machine Redis atteint 10 Go, le temps de synchronisation d'un nœud esclave sera de plusieurs minutes ; s'il y a plus de nœuds esclaves, la vitesse de récupération sera plus lente. Si la charge de lecture du système est très élevée et que le nœud esclave ne peut pas fournir de services pendant cette période, cela mettra beaucoup de pression sur le système.Réplication complète->timeout. Un cycle qui provoque une interruption de la réplication->reconnexion->réplication complète->timeout provoque une interruption de la réplication
...Le rôle de la réplication maître-esclave : les fichiers binaires AOF et RDB assurent une récupération rapide des données après les temps d'arrêt et évitent autant que possible la perte de données. Cependant, les services ne pouvaient toujours pas être fournis après un temps d'arrêt, de sorte qu'une architecture maître-esclave et une séparation lecture-écriture ont évolué.
, que je présenterai dans les articles suivants. Bienvenue à y prêter attention. 🎜Adresse originale : https://juejin.cn/post/6973928120332058654🎜🎜Auteur : Code Brother Byte🎜🎜🎜Pour plus de connaissances sur la programmation, veuillez visiter : 🎜Vidéo de programmation🎜 ! ! 🎜Bien que la réplication maître-esclave résolve ou atténue des problèmes tels que la redondance des données, la récupération après panne et l'équilibrage de charge en lecture, ses défauts sont toujours évidents :
La récupération après panne ne peut pas être automatisée, les opérations d'écriture ne peuvent pas être équilibrées, la capacité de stockage est limitée ; par une seule machine ; La solution à ces problèmes nécessite l'aide de sentinelles et de clusters
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!