Maison >base de données >tutoriel mysql >Comment utiliser le binlog, le redo log et le undo log de MySQL

Comment utiliser le binlog, le redo log et le undo log de MySQL

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBavant: 2023-06-03 12:59:241945parcourir

MySQL的binlog、redo log和undo log怎么使用

1. Binlog

Binlog est utilisé pour enregistrer des informations sur les opérations d'écriture effectuées dans la base de données. Il exclut les opérations de requête et est enregistré sur le disque au format binaire. Binlog est le journal logique de MySQL et est enregistré par la couche serveur. Les bases de données Mysql utilisant n'importe quel moteur de stockage enregistreront les journaux binlog.

Journal logique : peut être simplement compris comme une instruction SQL ;
Journal physique : les données dans MySQL sont stockées dans la page de données et le journal physique enregistre les modifications sur la page de données ;

Scénarios d'utilisation de Binlog

Projet Dans les applications pratiques, il existe deux principaux scénarios d'utilisation de binlog, à savoir la réplication maître-esclave et la récupération de données.

Principe de synchronisation maître-esclave MySQL

MySQL的binlog、redo log和undo log怎么使用

Lorsque le nœud esclave se connecte au nœud maître, le nœud maître créera un thread de vidage de journal pour envoyer le contenu du journal binaire. Lors des opérations de lecture dans le binlog, ce thread verrouillera le binlog sur le nœud maître. Une fois la lecture terminée, le verrou sera libéré avant même d'être envoyé au nœud esclave
; Lorsque la commande start slave est exécutée sur le nœud esclave, le nœud esclave créera un thread d'E/S pour se connecter au nœud maître et demandera le journal binaire mis à jour dans la bibliothèque maître. Une fois que le thread d'E/S a reçu la mise à jour du processus de vidage du journal binaire du nœud maître, il l'enregistre dans le journal de relais local
Le thread SQL est responsable de la lecture du contenu du journal de relais et de son analyse dans opérations spécifiques et leur exécution En fin de compte, assurer la cohérence des données maître-esclave ;
Principe de synchronisation maître-esclave de la base de données MySQL

Contenu du binlog

Comme mentionné ci-dessus, le binlog est un journal logique qui peut être simplement compris comme un journal logique. sql, mais en fait, il contient également la logique inverse de l'instruction sql exécutée. delete correspond à la suppression elle-même et la mise à jour d'insertion inverse contient des informations sur les lignes de données avant et après l'exécution de la mise à jour correspondante, l'insertion contient sa propre insertion et les informations de suppression correspondantes.

format binlog

Il existe trois formats de binlog, à savoir instruction, ligne et mixte. Avant MySQL 5.7.7, l'instruction était utilisée par défaut, et après MySQL 5.7.7, la ligne était utilisée par défaut. Le format du journal peut être modifié via binlog-format dans le fichier de configuration my.ini. (1) Déclaration : Réplication basée sur les instructions (SBR), chaque instruction SQL qui modifie les données sera enregistrée dans le binlog.

En particulier, comme mentionné ci-dessus, la nouvelle version (après MySQL 5.7.7) utilise le format de ligne par défaut. La ligne ici a également été optimisée en conséquence. Lors de l'opération de modification de table, le format d'instruction est utilisé pour l'enregistrement. les autres opérations utilisent toujours le format de ligne.

Minutage de vidage du binlog

Pour le moteur de stockage InnoDB, le binlog ne sera enregistré que lorsque la transaction est soumise. À ce moment, l'enregistrement est toujours dans la mémoire. MySQL contrôle le timing de vidage du binlog via sync_binlog, et le. la plage de valeurs est 0-N :

0 : Pas de vidage forcé sur le disque, le système décidera quand écrire sur le disque
1 : Chaque Après chaque soumission, le journal binaire sera écrit sur le disque ;
N : Le journal binaire sera écrit sur le disque pour toutes les N transactions ; 🎜 🎜#

Taille physique du fichier binlog

Vous pouvez contrôler la taille du binlog en configurant le paramètre max_binlog_size, qui se trouve dans le fichier my.ini fichier de configuration. Le système créera un nouveau fichier pour continuer à stocker les journaux lorsque la taille du journal dépasse la limite de capacité du fichier binlog. Que dois-je faire lorsqu'une transaction est relativement importante, ou lorsqu'il y a de plus en plus de logs et que l'espace physique qu'elle occupe est trop grand ? MySQL fournit un mécanisme de suppression automatique, qui peut être résolu en configurant le paramètre expire_logs_days dans le fichier de configuration my.ini. L'unité est en jours. Lorsque ce paramètre est à 0, cela signifie qu'il ne sera jamais supprimé ; lorsqu'il est à N, cela signifie qu'il sera automatiquement supprimé après le Nième jour.

2. redo log

redolog est le système de journalisation propriétaire du moteur InnoDB. Il est principalement utilisé pour assurer la durabilité des transactions et des fonctions anti-collision. Redolog est un journal physique qui enregistre les modifications spécifiques sur la page de données après l'exécution de l'instruction SQL.

Nous savons tous que lorsque MySQL est en cours d'exécution, les données seront chargées du disque vers la mémoire. Lorsqu'une instruction SQL est exécutée pour modifier les données, le contenu modifié n'est en fait que temporairement enregistré dans la mémoire. Si l'alimentation est coupée ou si d'autres circonstances se produisent à ce moment-là, ces modifications seront perdues. Par conséquent, après avoir modifié les données, MySQL recherchera des opportunités pour vider ces enregistrements mémoire sur le disque. Mais il y a un problème de performances, principalement sous deux aspects :

InnoDB interagit avec le disque en unités de données de pages, et une transaction ne peut modifier que plusieurs éléments d'une page, s'il s'agit d'une page de données complète. est renvoyé sur le disque, c'est un gaspillage de ressources ;

Une transaction peut impliquer plusieurs pages de données. Ces pages de données ne sont que logiquement continues, et non physiquement continues. trop médiocre ;

Par conséquent, MySQL a conçu le redolog pour enregistrer les modifications spécifiques apportées à la page de données par la transaction, puis renvoyer le redolog sur le disque. Vous avez peut-être des doutes. À l’origine, je voulais réduire io. Cela n’ajouterait-il pas un autre io ? Les concepteurs d'InnoDB en ont tenu compte dès le début de la conception. Les fichiers de journalisation sont généralement petits et des E/S séquentielles sont utilisées lors du vidage du disque. Meilleures performances par rapport aux E/S aléatoires.

Concept de base du redo log

redolog se compose de deux parties, l'une est le tampon de journalisation du cache de journal dans la mémoire et l'autre est le fichier journal refaire une session dans le fichier disque. Chaque fois que l'enregistrement de données est modifié, ces modifications seront d'abord écrites dans le tampon de journalisation, puis attendront l'opportunité appropriée pour vider les modifications de la mémoire dans le fichier de journalisation. Cette technologie consistant à écrire d'abord des journaux, puis à écrire sur le disque, est la technologie WAL (Write-Ahead Logging). Il convient de noter que le redolog est renvoyé sur le disque avant la page de données. Les modifications apportées à l'index clusterisé, à l'index secondaire et à la page d'annulation doivent toutes être enregistrées dans le redolog.
Dans un système d'exploitation informatique, les données du tampon dans l'espace utilisateur ne peuvent généralement pas être écrites directement sur le disque et doivent passer par le tampon d'espace du noyau du système d'exploitation (OS Buffer). Par conséquent, l'écriture du tampon de journalisation dans le fichier de journalisation l'écrit d'abord dans le tampon du système d'exploitation, puis le vide dans le fichier de journalisation via l'appel système fsync(). Le processus est le suivant :

#🎜. 🎜##🎜🎜 # mysql prend en charge trois délais d'écriture du tampon de journalisation dans le fichier de journalisation, qui peuvent être configurés via le paramètre innodb_flush_log_at_trx_commit. La signification de chaque valeur de paramètre est la suivante :

#🎜🎜. # MySQL的binlog、redo log和undo log怎么使用
Valeur du paramètre

Signification 0 (écriture différée) # 🎜🎜# lorsque la transaction est validée Les journaux dans le tampon de journalisation ne seront pas écrits dans le tampon du système d'exploitation. Au lieu de cela, les journaux dans le tampon de journalisation du système d'exploitation seront écrits dans le tampon du système d'exploitation toutes les secondes et fsync() le sera. être appelé pour écrire dans le fichier journal redo. C'est-à-dire que lorsqu'il est défini sur 0, les données sont écrites sur le disque (environ) toutes les secondes. Lorsque le système tombe en panne, 1 seconde de données sera perdue.

1 (écriture en temps réel, brossage en temps réel)

Chaque fois qu'une transaction est soumise, le journal dans le tampon de journalisation sera écrit dans le tampon du système d'exploitation et appelé fsync() vidé dans le fichier de journalisation. Cette méthode ne perdra aucune donnée même si le système tombe en panne, mais comme chaque soumission est écrite sur le disque, les performances d'E/S sont médiocres.

2 (écriture en temps réel, brossage différé)

Chaque soumission est uniquement écrite dans le tampon du système d'exploitation, puis fsync( est appelé toutes les secondes) Écrivez le journal dans le tampon du système d'exploitation dans le fichier de journalisation.

MySQL的binlog、redo log和undo log怎么使用
redo log format d'enregistrement
redolog adopte une taille fixe et un format d'écriture cyclique Lorsque le redolog est plein, il sera réécrit depuis le début. Pourquoi est-il conçu ainsi ?
L'objectif principal du redo log est de réduire le besoin de vidage des pages de données. Redolog enregistre les modifications sur la page de données, mais lorsque la page de données est également renvoyée sur le disque, ces enregistrements perdent leur effet. Par conséquent, lorsque MySQL détermine que le redolog précédent a perdu son effet, les nouvelles données écraseront les données invalides. Alors comment juger si cela doit être couvert ?
MySQL的binlog、redo log和undo log怎么使用
L'image ci-dessus est un diagramme schématique du fichier de journalisation redo. pos représente le numéro de séquence du journal LSN (numéro de séquence du journal) actuellement enregistré par redolog. Lorsque la page de données a été renvoyée sur le disque, le LSN dans le fichier de journalisation sera mis à jour, indiquant que les données avant que ce LSN n'ait été écrite sur le disque. Ce LSN est le point de contrôle. La partie entre le point de contrôle et le point de contrôle est la partie de rechange de redolog, qui est utilisée pour enregistrer de nouveaux enregistrements ; la partie entre le point de contrôle et le point de contrôle est la partie modifiée de la page de données que redolog a enregistrée, mais la page de données ne l'a pas fait. a été renvoyé sur le disque à ce moment-là. Lorsque la position d'écriture rattrape le point de contrôle, elle poussera d'abord le point de contrôle vers l'avant, quittera la position, puis enregistrera un nouveau journal.

Lors du démarrage d'innodb, peu importe qu'il ait été arrêté normalement ou anormalement la dernière fois, l'opération de récupération sera toujours effectuée. Lors de la récupération, le LSN dans la page de données sera vérifié en premier. Si ce LSN est plus petit que le LSN dans le redolog, c'est-à-dire la position d'écriture, cela signifie que les opérations inachevées sur la page de données sont enregistrées dans le redolog, puis il commencera à partir du point de contrôle le plus proche, commencera à synchroniser les données.

Est-il possible que le LSN dans la page de données soit plus grand que le LSN dans le redolog ? La réponse est bien sûr possible. Lorsque cela se produit, la partie au-delà du redolog ne sera pas refaite, car cela signifie en soi que ce qui a été fait n'a pas besoin d'être refait.
La différence entre le journal redo et le binlog

	redo log	binlog
Taille du fichier	La taille du journal redo est fixe.	Binlog peut définir la taille de chaque fichier binlog via le paramètre de configuration max_binlog_size.
Méthode d'implémentation	redo log est implémenté par la couche moteur InnoDB, tous les moteurs ne l'ont pas.	Binlog est implémenté par la couche serveur. Tous les moteurs peuvent utiliser les journaux binlog
Méthode d'enregistrement	refaire les enregistrements de journal dans une méthode d'écriture en boucle Lors de l'écriture jusqu'à la fin, il reviendra au début pour écrire les journaux dans un. boucle.	binlog est enregistré en ajoutant. Lorsque la taille du fichier est supérieure à la valeur donnée, les journaux suivants seront enregistrés dans de nouveaux fichiers
Scénarios applicables	redo log convient à la récupération en cas de crash (sans crash)	binlog Convient à la réplication maître-esclave et à la récupération de données

Cela ressort de la différence entre binlog et redo log : le journal binlog est uniquement utilisé pour l'archivage, et s'appuyer uniquement sur binlog n'a pas de fonctionnalités de sécurité en cas de crash. Mais seul le journal redo ne fonctionnera pas, car le journal redo est unique à InnoDB et les enregistrements du journal seront écrasés après avoir été écrits sur le disque. Par conséquent, le binlog et le redo log doivent être enregistrés en même temps pour garantir que lorsque la base de données est arrêtée et redémarrée, les données ne seront pas perdues.
Soumission en deux étapes
Ce qui précède présente brièvement le redolog et le binlog lors de la modification des données, ils enregistreront ces modifications, mais l'un est un journal physique et l'autre est un journal logique. Alors, comment ont-ils effectué le processus de modification ?

Supposons qu'il y ait une instruction de mise à jour à exécuter maintenant, mise à jour à partir de table_name défini c=c+1 où id=2, le processus d'exécution est le suivant :

Localisez d'abord l'enregistrement avec id=2 ;
L'exécuteur accède à la ligne de données donnée par le moteur, ajoute 1 à cette valeur, obtient une nouvelle ligne de données, puis appelle l'interface du moteur pour écrire cette nouvelle ligne de données
Le moteur met à jour cette nouvelle ; ligne de données dans la mémoire et la met à jour en même temps. L'opération est enregistrée dans redolog, qui est actuellement en état de préparation. Informez ensuite l'exécuteur que l'exécution est terminée et que vous pouvez soumettre la transaction à tout moment ;
L'exécuteur génère le binlog de cette opération et écrit le binlog sur le disque
L'exécuteur appelle la transaction de validation du moteur ; interface, et le moteur écrit le Le journal redo passe à l'état de validation et la mise à jour est terminée
Le diagramme schématique est le suivant :

Ce processus de division de l'écriture du journal redo en deux étapes, préparer et commit, est appelé commit en deux phases .
MySQL的binlog、redo log和undo log怎么使用 Redolog et binlog peuvent être utilisés pour représenter le statut de validation d'une transaction, et la validation en deux phases consiste à maintenir les deux états logiquement cohérents. Si vous n'utilisez pas de validation en deux phases, mais écrivez l'une d'abord, puis l'autre, cela peut poser des problèmes.

Pour le moment, la mise à jour est toujours utilisée à titre d'exemple. Supposons que l'identifiant actuel = 2 et qu'il y ait un champ c = 0. Analysez respectivement les situations suivantes :

Écrivez d'abord redolog, puis écrivez binlog

Supposons que redolog soit écrit en premier lorsque redolog est terminé mais que binlog n'est pas terminé, MySQL va Une exception soudaine provoque un redémarrage. Étant donné que le redolog a été écrit auparavant, les enregistrements modifiés existent toujours après le redémarrage du système, donc la valeur de c dans cette ligne après la récupération est 1. Cependant, en raison du redémarrage du système, cet enregistrement n'existe pas dans le binlog. Lors d'une sauvegarde ultérieure du journal, cette instruction n'existe pas dans le journal binaire enregistré. Ensuite, vous constaterez que si vous devez utiliser ce binlog pour restaurer la bibliothèque temporaire, car le binlog de cette instruction est perdu, la bibliothèque temporaire ne sera pas mise à jour cette fois. La valeur de c dans la ligne restaurée est 0, ce qui est. la même chose que la valeur de la bibliothèque d'origine différente. Écrivez d'abord binlog, puis redolog

Si vous écrivez d'abord binlog, puis redémarrez le système lors de l'écriture de redolog. Après le redémarrage, il n'y a aucun enregistrement de modification de c dans le redolog, et la valeur de c est toujours 0 pour le moment. Mais le journal "Changer c de 0 à 1" a été enregistré dans le binlog. Par conséquent, lorsque binlog est utilisé pour restaurer ultérieurement, une transaction supplémentaire sera générée. La valeur de c dans la ligne restaurée est 1, ce qui est différent de la valeur dans la base de données d'origine. Donc, pour résumer, si vous écrivez d'abord un certain journal puis écrivez un autre journal, l'état de la base de données sera incohérent avec l'état de la bibliothèque restaurée à l'aide de binlog.

3. annuler le journal

undolog est principalement utilisé pour enregistrer l'état avant qu'un certain enregistrement de ligne ne soit modifié. Utilisez undolog pour restaurer les enregistrements à l'état avant le début de la transaction lorsque la transaction est annulée. L'atomicité et la durabilité des transactions sont également obtenues par undolog. Le journal d'annulation enregistre principalement les modifications logiques des données. Par exemple, une instruction INSERT correspond à un journal d'annulation DELETE. Pour chaque instruction UPDATE, elle correspond à un journal d'annulation UPDATE opposé, de sorte que lorsqu'une erreur se produit, il peut être lancé. retour à avant l'état des données. Pendant le processus de récupération des données, la combinaison de binlog et redolog peut garantir l'exactitude de la récupération des données. Le processus fonctionnel de

undolog est le suivant :

MySQL的binlog、redo log和undo log怎么使用

Écrivez la version pré-modifiée dans le journal d'annulation avant le début de la transaction

Démarrez la modification et enregistrez les données modifiées dans la mémoire ;
Conserver la déconnexion sur le disque ;
Flasher les pages de données sur le disque ;
Soumission des transactions
Comme la redolog, la déconnexion doit également être renvoyée sur le disque avant les pages de données. Si l'annulation de la connexion est terminée, les informations qui y sont enregistrées peuvent être utilisées pour annuler la transaction afin de récupérer les données.

Dans une transaction, la même donnée peut être modifiée plusieurs fois, donc les enregistrements avant chaque modification doivent-ils être enregistrés dans l'undolog ? Dans ce cas, la quantité de journaux d'annulation sera trop importante et la redolog entrera en jeu à ce moment-là. Dans une transaction, si le même enregistrement est modifié, undolog enregistrera uniquement l'enregistrement d'origine avant le début de la transaction. Lorsque cet enregistrement est à nouveau modifié, redolog enregistrera les modifications ultérieures. Au cours du processus de récupération des données, la récupération des données est complétée par la coordination des fonctions de redolog et d'undolog, ainsi que par les opérations de rollback et de rollback. Le processus est le suivant :

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration：

Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer

Article précédent：Comment parcourir la base de données MySQL dans GolangArticle suivant：Comment parcourir la base de données MySQL dans Golang

Articles Liés

Voir plus