Maison >base de données >tutoriel mysql >Comment MySQL résout-il le problème de l'espace non libéré après la suppression d'une grande quantité de données ?

Comment MySQL résout-il le problème de l'espace non libéré après la suppression d'une grande quantité de données ?

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBavant
2022-07-01 12:20:417479parcourir

Cet article vous apporte des connaissances pertinentes sur mysql. Il organise principalement les problèmes liés au fait de ne pas libérer d'espace après la suppression d'une grande quantité de données. L'insertion et la mise à jour dans MySQL peuvent provoquer des fractionnements de pages, il y aura donc une fragmentation. un coup d'oeil, j'espère que cela sera utile à tout le monde.

Comment MySQL résout-il le problème de l'espace non libéré après la suppression d'une grande quantité de données ?

Apprentissage recommandé : Tutoriel vidéo mysql

Résumé de plusieurs solutions de défragmentation pour MySQL (résoudre le problème de l'espace non libéré après la suppression d'une grande quantité de données)

Connaissances de base ?

1.1. Pourquoi y a-t-il des fragments ?

  1. L'insertion et la mise à jour dans MySQL peuvent provoquer des fractionnements de pages, donc la fragmentation existe.

    Pour un grand nombre de MISE À JOUR, une fragmentation des fichiers se produira également. L'unité d'allocation de stockage physique minimale d'Innodb est une page, et les MISE À JOUR peuvent également provoquer des fractionnements de page fréquents qui rendront les pages clairsemées. , les données finales seront donc fragmentées.

  2. L'instruction delete marque en fait simplement les données et les enregistre dans une liste chaînée, formant ainsi un espace vide.

    Dans InnoDB, lorsque certaines lignes sont supprimées, ces lignes sont uniquement marquées comme "supprimées" au lieu d'être physiquement supprimées de l'index, donc l'espace n'est pas vraiment libéré et récupéré. Le thread Purge d'InnoDB nettoiera de manière asynchrone ces clés et lignes d'index inutiles.

  3. Lors d'une opération d'insertion, MySQL essaiera d'utiliser un espace vide, mais si un certain espace vide n'a pas été occupé par des données de taille appropriée et ne peut toujours pas être complètement occupé, il sera fragmenté

  4. Résumé ; :

    1. Les opérations d'ajout, de suppression et de modification sur la table peuvent provoquer des trous de données. Lorsqu'un grand nombre d'opérations d'ajout, de suppression et de modification sont effectuées sur la table, la possibilité de trous de données est relativement élevée.

    2. Plusieurs situations dans lesquelles MySQL supprime des données et s'il faut libérer de l'espace disque :

      1. drop, tronquer libère de l'espace disque immédiatement, qu'il s'agisse d'Innodb ou de MyISAM
      • truncate table est en fait un peu similaire à ; déposer la table puis créer, c'est juste que le processus de création de table a été optimisé, par exemple, le fichier de structure de la table existait déjà auparavant, etc. Par conséquent, la vitesse doit être proche de la vitesse de suppression de la table ;
      1. delete from table_name supprime toutes les données de la table. Pour MyISAM, l'espace disque sera libéré immédiatement (il doit être spécialement traité, ce qui est plus raisonnable. ), et InnoDB ne libérera pas d'espace disque. ;
      2. Pour la suppression de table_name où xxx; suppression conditionnelle, ni innodb ni MyISAM ne libéreront d'espace disque
      3. L'utilisation d'optimiser la table table_name après l'opération de suppression libérera immédiatement de l'espace disque ; Que ce soit innodb ou myisam. Par conséquent, pour atteindre l'objectif de libérer de l'espace disque, effectuez l'opération d'optimisation de la table après la suppression.
      4. Bien que l'espace disque ne soit pas libéré après la suppression de la table from, cet espace peut toujours être utilisé la prochaine fois que vous insérerez des données.

1.2 Problèmes causés par la fragmentation

  • Lorsque MySQL analyse les données, l'objet qu'il analyse est en fait la limite supérieure de la capacité requise de la liste, qui est la position maximale dans la zone où les données est écrit Part;

  • Une fois la table de la base de données MySQL supprimée, mise à jour et insérée plusieurs fois, l'espace table deviendra fragmenté. La défragmentation régulière de l'espace table et l'élimination de la fragmentation peuvent améliorer les performances d'accès à l'espace table.

  • Ce type de fragmentation augmente non seulement le coût de stockage, mais réduit également l'efficacité de l'analyse de la table en raison de la fragmentation des données.

  • Si les fragments ne sont pas défragmentés, ils peuvent occuper de l'espace disque pendant une longue période, entraînant une utilisation de plus en plus élevée du disque.

2. Comment nettoyer les débris ?

La condition préalable pour résoudre le problème est de trouver d'abord le problème, afin que nous puissions prescrire le bon remède.

2.1. Vérifiez l'état de fragmentation de la table

  1. Affichez chaque table fragmentée dans la base de données

    mysql> select concat('optimize table ',table_schema,'.',table_name,';'),data_free,engine from information_schema.tables where data_free>0 and engine !='MEMORY';
    +-----------------------------------------------------------+-----------+--------+
    | concat('optimize table ',table_schema,'.',table_name,';') | DATA_FREE | ENGINE |
    +-----------------------------------------------------------+-----------+--------+
    | optimize table abc.t_user_answer;                    		|   2097152 | InnoDB |
    | optimize table mysql.time_zone_transition;                |   4194304 | InnoDB |
    | optimize table mysql.time_zone_transition_type;           |   4194304 | InnoDB |
    | optimize table mysql.user;                                |   4194304 | InnoDB |
    。。。。
  2. Affichez l'état de fragmentation de la table spécifiée

     mysql> show table status like 't_user'\G
     *************************** 1. row ***************************
                Name: t_user
              Engine: InnoDB
             Version: 10
          Row_format: Dynamic
                Rows: 4333
      Avg_row_length: 589
         Data_length: 2555904
     Max_data_length: 0
        Index_length: 2719744
           Data_free: 4194304
      Auto_increment: NULL
         Create_time: 2021-11-19 10:13:31
         Update_time: 2022-04-20 14:28:42
          Check_time: NULL
           Collation: utf8mb4_general_ci
            Checksum: NULL
      Create_options:
             Comment:
     1 row in set (0.00 sec)

    Data_free : 4194304 représente le nombre d'octets dans le fragment. Si la table de données est fréquemment supprimée, un grand nombre d'enregistrements Data_free seront fréquemment supprimés ou des tables avec des champs de longueur variable seront modifiées.

  3. Trouver la table la plus gravement fragmentée

    SELECT table_schema, TABLE_NAME, concat(data_free/1024/1024, 'M') as data_free
    FROM `information_schema`.tables
    WHERE data_free > 3 * 1024 * 1024
    	AND ENGINE = 'innodb'
    ORDER BY data_free DESC

2.2 Méthode pour nettoyer les fragments (récupérer de l'espace)

Référence officielle du document
Comment MySQL résout-il le problème de lespace non libéré après la suppression dune grande quantité de données ?

通常有这几种做法

  1. alter table tb_test engine=innodb; (本质上是 recreate)
  2. optimize table tb_test; (本质上是 recreate,但是在不同创建下会有区别)
  3. ALTER TABLE tablename FORCE (在InnoDB表中等价于 alter table tb_test engine=innodb; )
  4. mysqlcheck 批量表空间优化
  5. gh-ost/pt-osc
  6. pt-online-schema-change (本质上也是 先备份旧表数据,然后 truncate 旧表)

1. alter table tb_test engine=innodb 原理介绍

这其实是一个NULL操作,表面上看什么也不做,实际上重新整理碎片了.当执行优化操作时,实际执行的是一个空的 ALTER 命令,但是这个命令也会起到优化的作用,它会重建整个表,删掉未使用的空白空间.

Running ALTER TABLE tbl_name ENGINE=INNODB on an existing InnoDB table performs a “null” ALTER TABLE operation, which can be used to defragment an InnoDB table, as described in Section 15.11.4, “Defragmenting a Table”. Running ALTER TABLE tbl_name FORCE on an InnoDB table performs the same function.

    MySQL5.6 开始采用 Inplace 方式重建表,Alter 期间,支持 DML 查询和更新操作,语句为 alter table t engine=innodb, ALGORITHM=inplace;之所以支持 DML 更新操作,是因为数据拷贝期间会将 DML 更新操作记录到 Row log 中。

    重建过程中最耗时的就是拷贝数据的过程,这个过程中支持 DML 查询和更新操作,对于整个 DDL 来说,锁时间很短,就可以近似认为是 Online DDL。

    执行过程:

    1、获取 MDL(Meta Data Lock)写锁,innodb 内部创建与原表结构相同的临时文件

    2、拷贝数据之前,MDL 写锁退化成 MDL 读锁,支持 DML 更新操作

    3、根据主键递增顺序,将一行一行的数据读出并写入到临时文件,直至全部写入完成。并且,会将拷贝期间的 DML 更新操作记录到 Row log 中

    4、上锁,再将 Row log 中的数据应用到临时文件

    5、互换原表和临时表表名

    6、删除临时表

2. optimize table xxx;

OPTIMIZE TABLE语句可以重新组织表、索引的物理存储,减少存储空间,提高访问的I/O效率。类似于碎片整理功能。

MySQL可以通过optimize table语句释放表空间,重组表数据和索引的物理页,减少表所占空间和优化读写性能

  1. 使用语法

    OPTIMIZE [LOCAL | NO_WRITE_TO_BINLOG] TABLE tbl_n说ame [, tbl_name] …

    • 对于主从架构, LOCAL 参数可以让这个过程不写入 binlog ,这样在主库上执行时就不会同步给从库了
    • 默认情况下,MySQL将OPTIMIZE TABLE语句写入二进制日志,以便它们复制到slave服务器。如果不想写二进制日志,使用命令时加上NO_WRITE_To_BINLOG或LOCAL关键字即可。
    • 使用这个语句需要具有对目标表的SELECT、INSERT权限。
  2. 注意:

    1. 需要有足够的空间才能进行OPTIMIZE TABLE。 (剩余空间必须 > 被 OPTIMIZE 的表的大小)

    2. OPTIMIZE 只对独立表空间(innodb_file_per_table=1)才有用,对共享表空间不起作用。

      对于共享表空间,如果需要瘦身: 必须将数据导出,删除ibdata1,然后将 innodb_file_per_table 设置为独立表空间, 然后将数据导入进来。

    3. 对于InnoDB的表,OPTIMIZE TABLE 的工作原理如下

      对于InnoDB表, OPTIMIZE TABLE映射到ALTER TABLE … FORCE(或者这样翻译:在InnoDB表中等价 ALTER TABLE … FORCE),它重建表以更新索引统计信息并释放聚簇索引中未使用的空间。

      当您在InnoDB表上运行时,它会显示在OPTIMIZE TABLE的输出中,如下所示:
      mysql> OPTIMIZE TABLE foo; 
      +----------+----------+----------+---------------------------------------+ 
      | Table    | Op       | Msg_type | Msg_text                                                          | 
      +----------+----------+----------+---------------------------------------+ 
      | test.foo | optimize | note     | Table does not support optimize, doing recreate + analyze instead | 
      | test.foo | optimize | status   | OK                                                                | 
      +----------+----------+----------+---------------------------------------+ 
      
      # 但这个提示语可以忽略,从严格的意义讲,说InnoDB不支持optimize table,其实不太准确。 因为 MYSQL的文档说明了,当INNODB 的表,MYSQL会以 ALTER TABLE force  +  analyze 去执行这个命令(相当于做了recreate和analyze)。 所以最终还是会看到 OK 的状态。 
      # https://stackoverflow.com/questions/30635603/what-does-table-does-not-support-optimize-doing-recreate-analyze-instead-me
    4. 对于MYISAM表,OPTIMIZE TABLE 的工作原理:
      1. 如果表已删除或分隔行,就修复该表。
      2. 如果索引页没有排序,就排序它们。
      3. 如果表的统计信息不是最新的(而且修复不能通过对索引进行排序),就更新它们。

    5. **执行时也可以发现报错: Temporary file write failure. **

      建议参考这片文章:
      Mysql optimize table 时报错 Temporary file write failure. 的解决方案

  3. optimize 语句的官网介绍

    • 如果您已经删除了表的一大部分,或者如果您已经对含有可变长度行的表(含有VARCHAR, BLOB或TEXT列的表)进行了很多更改,则应使用 OPTIMIZE TABLE。

    • 被删除的记录被保持在链接清单中,后续的INSERT操作会重新使用旧的记录位置。您可以使用OPTIMIZE TABLE来重新利用未使用的空间,并整理数据文件的碎片。

    • 在多数的设置中,您根本不需要运行OPTIMIZE TABLE。即使您对可变长度的行进行了大量的更新,您也不需要经常运行,每周一次或每月一次 即可,只对特定的表运行。

  4. Mysql 5.6 之前 在OPTIMIZE TABLE运行过程中,MySQL会锁定表,5.6之后有了 Online DDL 则大大减少了锁表时间。

3. alter table、analyze table和optimize table区别

  • alter table tb_test engine = innodb;

    • (也就是 recreate)MySQL 5.5以前用Offline的方式重建表,5.6以后用Online的方式重建表;
  • analyze table tb_test ;

    • 重新统计表的索引信息,不会修改数据,不会重建表,整个过程加MDL读
  • optimize table tb_test ;

    • est le processus de modification de la table xxx = innodb; + analyse de la table xxx ;.

4. Quel est le meilleur, OPTIMIZE TABLE ou ALTER TABLE xxxx ENGINE= INNODB ?

  • OPTIMIZE TABLE ou ALTER TABLE xxxx ENGINE= INNODB sont fondamentalement les mêmes. Mais dans certains cas, ALTER TABLE xxxx ENGINE= INNODB est meilleur.
    • Par exemple : la variable système old_alter_table n'est pas activée, etc.
  • De plus : Pour les tables de type MyISAM, utiliser ALTER TABLE xxxx ENGINE= INNODB est évidemment mieux que OPTIMIZE TABLE.

2.3 Recommandation officielle

MySQL recommande officiellement de ne pas défragmenter fréquemment (toutes les heures ou tous les jours). Généralement, il ne doit être défragmenté qu'une fois par semaine ou mensuellement selon la situation réelle (nous nettoyons actuellement MySQL à 4 heures du matin tous les mois). Fragmentation des tables dans toutes les instances)

Apprentissage recommandé : Tutoriel vidéo MySQL

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer