Maison  >  Article  >  base de données  >  Explication détaillée du problème de synchronisation maître-esclave MySQL et du processus de solution

Explication détaillée du problème de synchronisation maître-esclave MySQL et du processus de solution

零下一度
零下一度original
2017-06-27 10:03:301574parcourir

Un processus de solution de synchronisation maître-esclave mysql

La structure de la table a été modifiée avant-hier, et la structure des champs d'une des tables a été élargie de varchar(30) Étendu à varchar(50), les données de la table représentent plus de 1,2 million. L'exécution dans la base de données principale ne prend que 40 secondes, mais la synchronisation à partir de la base de données esclave prend 4 heures.

Bien que la bibliothèque principale s'exécute rapidement, le nombre de lignes affectées est de 1,2 million de lignes. La bibliothèque esclave synchronise les changements structurels de 1,2 million de lignes, au lieu de simplement exécuter des commandes SQL pour modifier la bibliothèque esclave.
Je ne l'ai pas remarqué au début, mais plus tard, lorsque les affaires étaient au ralenti, j'ai commencé à sentir que quelque chose n'allait pas, alors je suis rapidement allé sur MySQL pour vérifier le processus MySQL actuellement bloqué :

show proccesslist

Les résultats ici ne sont pas les résultats à ce moment-là (de nombreuses requêtes étaient bloquées à ce moment-là) :

| Id     | User  | Host            | db   | Command     | Time   | State                                                                 | Info             |
+--------+-------+-----------------+------+-------------+--------+-----------------------------------------------------------------------+------------------+
| 722874 | bakup | 127.0.0.1:36759 | NULL | Binlog Dump | 281055 | Master has sent all binlog to slave; waiting for binlog to be updated | NULL             |
| 991867 | root  | localhost       | NULL | Sleep       |    780 |                                                                       | NULL             |
| 992585 | root  | localhost       | NULL | Query       |      0 | NULL                                                                  | show processlist |

1.Id : Processus id, c'est très difficile quand on veut tuer une déclaration, ça marche.

2.Utilisateur : Affichez l'unique utilisateur précédent. Si vous n'êtes pas root, cette commande affichera uniquement les instructions SQL relevant de votre autorité.

3.Host : Affichez à partir de quelle adresse IP et de quel port cette déclaration est envoyée

4.db : Affichez à quel processus ce processus est actuellement connecté à la base de données

5.Command :Affiche les commandes exécutées de la connexion actuelle, sleep (sleep), query (query), connection (connect), binlog (master-slave)

6.Time : La durée de cet état, l'unité est en secondes.

7.State :Affiche l'état de l'instruction SQL en utilisant la connexion actuelle. Il s'agit d'une colonne très importante. Il y aura des descriptions de tous les états plus tard. Veuillez noter que l'état n'est qu'un certain état. lors de l'exécution de l'instruction. Une instruction SQL, par exemple, a été interrogée. Elle devra peut-être passer par la copie dans la table tmp, le résultat du tri, l'envoi des données et d'autres états avant de pouvoir être terminée

<.>8.info :

Afficher cette instruction SQL


À l'heure actuelle, le processus de blocage est tué, c'est-à-dire le processus de modification synchrone de la structure

kill 722874

a pu reprendre les requêtes commerciales normales, mais un nouveau problème est apparu. Le maître et. l'esclave a été suspendu de force, une erreur s'est produite, la base de données principale n'a pas pu être synchronisée avec la base de données esclave et les dernières données commerciales n'ont pas pu être synchronisées.

Commande de requête depuis la bibliothèque (le résultat ici n'est pas le résultat à ce moment-là (c'était un message d'erreur à l'époque)) :

(Mon Jun 26 20:49:40 2017) db_2 >>show slave status\G*************************** 1. row ***************************   Slave_IO_State: Waiting for master to send event  Master_Host: 127.0.0.1  Master_User: bakup
                  Master_Port: 3306Connect_Retry: 60  Master_Log_File: mysql-bin.000330  Read_Master_Log_Pos: 445043216   Relay_Log_File: 174-relay-bin.000043Relay_Log_Pos: 445043362Relay_Master_Log_File: mysql-bin.000330 Slave_IO_Running: Yes
            Slave_SQL_Running: Yes
              Replicate_Do_DB: 
          Replicate_Ignore_DB: information_schema,mysql,performance_schema,test,zabbix,information_schema,mysql,performance_schema,test,zabbix
           Replicate_Do_Table: 
       Replicate_Ignore_Table: 
      Replicate_Wild_Do_Table: 
  Replicate_Wild_Ignore_Table: 
                   Last_Errno: 0   Last_Error: 
                 Skip_Counter: 0  Exec_Master_Log_Pos: 445043216  Relay_Log_Space: 445043559  Until_Condition: None
               Until_Log_File: 
                Until_Log_Pos: 0   Master_SSL_Allowed: No
           Master_SSL_CA_File: 
           Master_SSL_CA_Path: 
              Master_SSL_Cert: 
            Master_SSL_Cipher: 
               Master_SSL_Key: 
        Seconds_Behind_Master: 0Master_SSL_Verify_Server_Cert: No
                Last_IO_Errno: 0Last_IO_Error: 
               Last_SQL_Errno: 0   Last_SQL_Error: 
  Replicate_Ignore_Server_Ids: 
             Master_Server_Id: 11 row in set (0.00 sec)
Donc nous avons consulté le fonctionnement et l'entretien, Les méthodes suivantes ont été adoptées :

 恢复主库到改变字段前的状态
2 停止主从二进制日志的写入,主从同步停止
3 开始改变主库字段结构
4 改变从库字段结构(注意此时主从同步已经停止)
5 修正此前发生的同步错误
6 恢复主从二进制日志的写入
7 重新开启主从同步
Le problème a été résolu en 40 minutes environ.

Cette opération est également un peu précipitée. Il serait préférable d'apporter des modifications structurelles à de grandes quantités de données la nuit, lorsque l'arrière-plan est difficilement accessible. Une évaluation a également été réalisée le même jour et elle pouvait aboutir en 2 heures.

Ci-joint, indiquer les informations de la colonne :

Checking table
 正在检查数据表(这是自动的)。
Closing tables
 正在将表中修改的数据刷新到磁盘中,同时正在关闭已经用完的表。这是一个很快的操作,如果不是这样的话,就应该确认磁盘空间是否已经满了或者磁盘是否正处于重负中。
Connect Out
 复制从服务器正在连接主服务器。
Copying to tmp table on disk
 由于临时结果集大于tmp_table_size,正在将临时表从内存存储转为磁盘存储以此节省内存。
Creating tmp table
 正在创建临时表以存放部分查询结果。
deleting from main table
 服务器正在执行多表删除中的第一部分,刚删除第一个表。
deleting from reference tables
 服务器正在执行多表删除中的第二部分,正在删除其他表的记录。
Flushing tables
 正在执行FLUSH TABLES,等待其他线程关闭数据表。
Killed
 发送了一个kill请求给某线程,那么这个线程将会检查kill标志位,同时会放弃下一个kill请求。MySQL会在每次的主循环中检查kill标志位,不过有些情况下该线程可能会过一小段才能死掉。如果该线程程被其他线程锁住了,那么kill请求会在锁释放时马上生效。
Locked
 被其他查询锁住了。
Sending data
 正在处理SELECT查询的记录,同时正在把结果发送给客户端。
Sorting for group
 正在为GROUP BY做排序。
 Sorting for order
 正在为ORDER BY做排序。
Opening tables
 这个过程应该会很快,除非受到其他因素的干扰。例如,在执ALTER TABLE或LOCK TABLE语句行完以前,数据表无法被其他线程打开。正尝试打开一个表。
Removing duplicates
 正在执行一个SELECT DISTINCT方式的查询,但是MySQL无法在前一个阶段优化掉那些重复的记录。因此,MySQL需要再次去掉重复的记录,然后再把结果发送给客户端。
Reopen table
 获得了对一个表的锁,但是必须在表结构修改之后才能获得这个锁。已经释放锁,关闭数据表,正尝试重新打开数据表。
Repair by sorting
 修复指令正在排序以创建索引。
Repair with keycache
 修复指令正在利用索引缓存一个一个地创建新索引。它会比Repair by sorting慢些。
Searching rows for update
 正在讲符合条件的记录找出来以备更新。它必须在UPDATE要修改相关的记录之前就完成了。
Sleeping
 正在等待客户端发送新请求.
System lock 正在等待取得一个外部的系统锁。如果当前没有运行多个mysqld服务器同时请求同一个表,那么可以通过增加--skip-external-locking参数来禁止外部系统锁。
Upgrading lock INSERT DELAYED正在尝试取得一个锁表以插入新记录。
Updating
 正在搜索匹配的记录,并且修改它们。
User Lock
 正在等待GET_LOCK()。
Waiting for tables
 该线程得到通知,数据表结构已经被修改了,需要重新打开数据表以取得新的结构。然后,为了能的重新打开数据表,必须等到所有其他线程关闭这个表。以下几种情况下会产生这个通知:FLUSH TABLES tbl_name, ALTER TABLE, RENAME TABLE, REPAIR TABLE, ANALYZE TABLE,或OPTIMIZE TABLE。
waiting for handler insert
 INSERT DELAYED已经处理完了所有待处理的插入操作,正在等待新的请求。

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn