Heim  >  Artikel  >  Datenbank  >  Detaillierte Erläuterung des MySQL-Master-Slave-Synchronisierungsproblems und des Lösungsprozesses

Detaillierte Erläuterung des MySQL-Master-Slave-Synchronisierungsproblems und des Lösungsprozesses

零下一度
零下一度Original
2017-06-27 10:03:301574Durchsuche

Ein MySQL-Master-Slave-Synchronisationslösungsprozess

Vorgestern wurde die Tabellenstruktur geändert und die Feldstruktur einer der Tabellen erweitert Von varchar(30) Erweitert auf varchar(50) sind es mehr als 1,2 Millionen Tabellendaten. Die Ausführung in der Hauptdatenbank dauert nur 40 Sekunden, die Synchronisierung aus der Slave-Datenbank dauert jedoch 4 Stunden.

Obwohl die Hauptbibliothek sehr schnell ausgeführt wird, beträgt die Anzahl der betroffenen Zeilen 1,2 Millionen Zeilen. Die Slave-Bibliothek synchronisiert die strukturellen Änderungen von 1,2 Millionen Zeilen, anstatt einfach SQL-Befehle auszuführen, um die Slave-Bibliothek zu ändern.
Zuerst habe ich es nicht bemerkt, aber später, als das Geschäft langsam lief, bekam ich das Gefühl, dass etwas nicht stimmte, also ging ich schnell zu MySQL, um den aktuell blockierten MySQL-Prozess zu überprüfen:

show proccesslist

Die Ergebnisse hier sind nicht die Ergebnisse zu diesem Zeitpunkt (viele Abfragen wurden zu diesem Zeitpunkt blockiert):

| Id     | User  | Host            | db   | Command     | Time   | State                                                                 | Info             |
+--------+-------+-----------------+------+-------------+--------+-----------------------------------------------------------------------+------------------+
| 722874 | bakup | 127.0.0.1:36759 | NULL | Binlog Dump | 281055 | Master has sent all binlog to slave; waiting for binlog to be updated | NULL             |
| 991867 | root  | localhost       | NULL | Sleep       |    780 |                                                                       | NULL             |
| 992585 | root  | localhost       | NULL | Query       |      0 | NULL                                                                  | show processlist |

1.Id: Prozess Ich würde sagen, es ist sehr schwierig, wenn Sie eine Anweisung beenden möchten, die funktioniert.

2.Benutzer: Zeigen Sie den einzelnen vorherigen Benutzer an. Wenn Sie nicht root sind, zeigt dieser Befehl nur die SQL-Anweisungen innerhalb Ihrer Autorität an.

3.Host: Zeigen Sie an, von welcher IP und welchem ​​Port diese Anweisung gesendet wird

4.db: Zeigen Sie an, mit welchem ​​Prozess dieser Prozess derzeit mit der Datenbank verbunden ist

5.Befehl:Zeigt die ausgeführten Befehle der aktuellen Verbindung, Schlaf (Schlaf), Abfrage (Abfrage), Verbindung (Verbinden), Binlog (Master-Slave) an

6.Zeit: Die Dauer dieses Zustands, die Einheit ist Sekunden.

7.Status:Zeigt den Status der SQL-Anweisung unter Verwendung der aktuellen Verbindung an. Es handelt sich um eine sehr wichtige Spalte. Bitte beachten Sie, dass es sich bei dem Status nur um einen bestimmten Status handelt Bei der Ausführung der Anweisung wurde beispielsweise eine SQL-Anweisung abgefragt, die das Kopieren in die tmp-Tabelle, das Sortieren von Daten und andere Zustände erfordern muss, bevor sie abgeschlossen werden kann 🎜>8.info:Zeigen Sie diese SQL-Anweisung an

Derzeit wird der Blockierungsprozess beendet, dh der Prozess der synchronen Änderung der Struktur

kill 722874
konnte die normalen Geschäftsabfragen wieder aufnehmen, aber es trat ein neues Problem auf Slave-Datenbanken wurden zwangsweise angehalten, es ist ein Fehler aufgetreten, die Master-Datenbank konnte nicht mit der Slave-Datenbank synchronisiert werden und die neuesten Geschäftsdaten konnten nicht synchronisiert werden.

Befehl aus der Datenbank abfragen (das Ergebnis hier ist nicht das damalige Ergebnis (es war damals eine Fehlermeldung)):

So Wir haben den Betrieb und die Wartung konsultiert. Die folgenden Methoden wurden übernommen:
(Mon Jun 26 20:49:40 2017) db_2 >>show slave status\G*************************** 1. row ***************************   Slave_IO_State: Waiting for master to send event  Master_Host: 127.0.0.1  Master_User: bakup
                  Master_Port: 3306Connect_Retry: 60  Master_Log_File: mysql-bin.000330  Read_Master_Log_Pos: 445043216   Relay_Log_File: 174-relay-bin.000043Relay_Log_Pos: 445043362Relay_Master_Log_File: mysql-bin.000330 Slave_IO_Running: Yes
            Slave_SQL_Running: Yes
              Replicate_Do_DB: 
          Replicate_Ignore_DB: information_schema,mysql,performance_schema,test,zabbix,information_schema,mysql,performance_schema,test,zabbix
           Replicate_Do_Table: 
       Replicate_Ignore_Table: 
      Replicate_Wild_Do_Table: 
  Replicate_Wild_Ignore_Table: 
                   Last_Errno: 0   Last_Error: 
                 Skip_Counter: 0  Exec_Master_Log_Pos: 445043216  Relay_Log_Space: 445043559  Until_Condition: None
               Until_Log_File: 
                Until_Log_Pos: 0   Master_SSL_Allowed: No
           Master_SSL_CA_File: 
           Master_SSL_CA_Path: 
              Master_SSL_Cert: 
            Master_SSL_Cipher: 
               Master_SSL_Key: 
        Seconds_Behind_Master: 0Master_SSL_Verify_Server_Cert: No
                Last_IO_Errno: 0Last_IO_Error: 
               Last_SQL_Errno: 0   Last_SQL_Error: 
  Replicate_Ignore_Server_Ids: 
             Master_Server_Id: 11 row in set (0.00 sec)

Das Problem wurde in etwa 40 Minuten gelöst.
 恢复主库到改变字段前的状态
2 停止主从二进制日志的写入,主从同步停止
3 开始改变主库字段结构
4 改变从库字段结构(注意此时主从同步已经停止)
5 修正此前发生的同步错误
6 恢复主从二进制日志的写入
7 重新开启主从同步
Dieser Vorgang ist auch etwas überstürzt. Es sollte besser sein, nachts, wenn auf den Hintergrund kaum zugegriffen wird, strukturelle Änderungen an großen Datenmengen vorzunehmen. Am selben Tag wurde auch eine Bewertung durchgeführt, die innerhalb von 2 Stunden erfolgreich sein konnte.

Anbei, geben Sie die Spalteninformationen an:

Checking table
 正在检查数据表(这是自动的)。
Closing tables
 正在将表中修改的数据刷新到磁盘中,同时正在关闭已经用完的表。这是一个很快的操作,如果不是这样的话,就应该确认磁盘空间是否已经满了或者磁盘是否正处于重负中。
Connect Out
 复制从服务器正在连接主服务器。
Copying to tmp table on disk
 由于临时结果集大于tmp_table_size,正在将临时表从内存存储转为磁盘存储以此节省内存。
Creating tmp table
 正在创建临时表以存放部分查询结果。
deleting from main table
 服务器正在执行多表删除中的第一部分,刚删除第一个表。
deleting from reference tables
 服务器正在执行多表删除中的第二部分,正在删除其他表的记录。
Flushing tables
 正在执行FLUSH TABLES,等待其他线程关闭数据表。
Killed
 发送了一个kill请求给某线程,那么这个线程将会检查kill标志位,同时会放弃下一个kill请求。MySQL会在每次的主循环中检查kill标志位,不过有些情况下该线程可能会过一小段才能死掉。如果该线程程被其他线程锁住了,那么kill请求会在锁释放时马上生效。
Locked
 被其他查询锁住了。
Sending data
 正在处理SELECT查询的记录,同时正在把结果发送给客户端。
Sorting for group
 正在为GROUP BY做排序。
 Sorting for order
 正在为ORDER BY做排序。
Opening tables
 这个过程应该会很快,除非受到其他因素的干扰。例如,在执ALTER TABLE或LOCK TABLE语句行完以前,数据表无法被其他线程打开。正尝试打开一个表。
Removing duplicates
 正在执行一个SELECT DISTINCT方式的查询,但是MySQL无法在前一个阶段优化掉那些重复的记录。因此,MySQL需要再次去掉重复的记录,然后再把结果发送给客户端。
Reopen table
 获得了对一个表的锁,但是必须在表结构修改之后才能获得这个锁。已经释放锁,关闭数据表,正尝试重新打开数据表。
Repair by sorting
 修复指令正在排序以创建索引。
Repair with keycache
 修复指令正在利用索引缓存一个一个地创建新索引。它会比Repair by sorting慢些。
Searching rows for update
 正在讲符合条件的记录找出来以备更新。它必须在UPDATE要修改相关的记录之前就完成了。
Sleeping
 正在等待客户端发送新请求.
System lock 正在等待取得一个外部的系统锁。如果当前没有运行多个mysqld服务器同时请求同一个表,那么可以通过增加--skip-external-locking参数来禁止外部系统锁。
Upgrading lock INSERT DELAYED正在尝试取得一个锁表以插入新记录。
Updating
 正在搜索匹配的记录,并且修改它们。
User Lock
 正在等待GET_LOCK()。
Waiting for tables
 该线程得到通知,数据表结构已经被修改了,需要重新打开数据表以取得新的结构。然后,为了能的重新打开数据表,必须等到所有其他线程关闭这个表。以下几种情况下会产生这个通知:FLUSH TABLES tbl_name, ALTER TABLE, RENAME TABLE, REPAIR TABLE, ANALYZE TABLE,或OPTIMIZE TABLE。
waiting for handler insert
 INSERT DELAYED已经处理完了所有待处理的插入操作,正在等待新的请求。

Das obige ist der detaillierte Inhalt vonDetaillierte Erläuterung des MySQL-Master-Slave-Synchronisierungsproblems und des Lösungsprozesses. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn