Maison  >  Article  >  base de données  >  Explication détaillée sur la façon d'optimiser la vitesse des requêtes lorsque MySQL traite de grandes quantités de données

Explication détaillée sur la façon d'optimiser la vitesse des requêtes lorsque MySQL traite de grandes quantités de données

怪我咯
怪我咯original
2017-04-30 10:10:371502parcourir

Récemment, en raison de besoins professionnels, j'ai commencé à prêter attention aux méthodes d'optimisation associées pour l'instruction select query de la base de données Mysql Friends. qui en a besoin peuvent s'y référer

En raison des projets auxquels j'ai participé, j'ai découvert que lorsque le volume de données de la table mysql atteint des millions, l'efficacité des requêtes SQL ordinaires s'effondre, et s'il y a beaucoup de requêtes conditions dans lesquelles la vitesse des requêtes est tout simplement intolérable. Une fois, j'ai testé une requête conditionnelle sur une table contenant plus de 4 millions d'enregistrements (avec index ), et le temps de requête atteignait 40 secondes. Je pense qu'un délai de requête aussi élevé rendrait fou n'importe quel utilisateur. . Par conséquent, il est très important de savoir comment améliorer l’efficacité des requêtes d’instructions SQL. Voici 30 méthodes d'optimisation des instructions de requête SQL largement diffusées sur Internet :

1. Essayez d'éviter d'utiliser != ou <>opérateur dans la clause Where, sinon cela will Le moteur abandonne l'utilisation de l'index et effectue une analyse complète de la table.

2. Pour optimiser la requête, essayez d'éviter les analyses de table complètes. Tout d'abord, pensez à créer des index sur les colonnes impliquées dans Where et à trier par.

3. Essayez d'éviter de juger la valeur nulle des champs dans la clause Where, sinon le moteur abandonnera l'utilisation de l'index et effectuera une analyse complète de la table, telle que :
sélectionnez l'identifiant à partir de t où num is null
Vous pouvez définir la valeur par défaut 0 sur num, vous assurer qu'il n'y a pas de valeur nulle dans la colonne num du tableau, puis interroger comme ceci :
sélectionner l'identifiant de t où num=0

4. Essayez d'éviter dans la clause Where d'utiliser ou de connecter les conditions, sinon le moteur abandonnera l'utilisation de l'index et effectuera une analyse complète de la table, telle que :
sélectionnez l'identifiant à partir de t où num=10 ou num =20
Vous pouvez effectuer une requête comme ceci :
sélectionnez l'identifiant à partir de t où num=10
union all
sélectionnez l'identifiant à partir de t où num=20

5. provoque également une analyse complète de la table : (ne peut pas précéder le signe de pourcentage)
sélectionnez l'identifiant à partir de t où le nom est comme '�c%'
Pour améliorer l'efficacité, vous pouvez envisager une recherche en texte intégral.

6. In et not in doivent également être utilisés avec prudence, sinon cela entraînera une analyse complète de la table, telle que :
sélectionnez l'identifiant à partir de t où num in(1,2,3)
Pour les valeurs continues, si vous pouvez utiliser between, n'utilisez pas in :
sélectionnez l'identifiant de t où num entre 1 et 3

7 Si des paramètres sont utilisés dans la clause Where, ce sera le cas. provoque également une analyse complète de la table. Étant donné que SQL ne résout que les variables locales au moment de l'exécution, l'optimiseur ne peut pas différer la sélection d'un plan d'accès jusqu'à l'exécution, il doit effectuer la sélection au moment de la compilation ; Cependant, si le plan d'accès est créé au moment de la compilation, les valeurs des variables sont toujours inconnues et ne peuvent pas être utilisées comme entrée pour la sélection d'index. Par exemple, l'instruction suivante effectuera une analyse complète de la table :
select id from t which num=@num
peut être modifié pour forcer la requête à utiliser un index :
select id from t with (index (nom de l'index)) où num= @num

8. Essayez d'éviter d'effectuer des opérations expression sur les champs de la clause Where, ce qui entraînerait l'abandon de l'utilisation de l'index par le moteur. une analyse complète de la table. Par exemple :
sélectionnez l'identifiant de t où num/2=100
doit être remplacé par :
sélectionnez l'identifiant de t où num=100*2

9 Essayez d'éviter les clauses Where. Les opérations de fonction sont effectuées sur les champs du champ, ce qui amènera le moteur à abandonner l'utilisation de l'index et à effectuer une analyse complète de la table. Par exemple :
select id from twhere substring(name,1,3)='abc'–name id commençant par abc
select id from twhere datediff(day,createdate,'2005-11-30′ )=0–'2005-11-30′L'identifiant généré
doit être modifié par :
sélectionnez l'identifiant à partir de t où le nom est comme 'abc%'
sélectionnez l'identifiant à partir de t où créé>='2005- 11 -30′ et createate<'2005-12-1′

10. N'effectuez pas de fonctions, d'opérations arithmétiques ou d'autres opérations d'expression sur le côté gauche de "=" dans la clause Where, sinon le système pourrait ne pas être utilisé correctement index.

11. Lors de l'utilisation d'un champ d'index comme condition, si l'index est un index composite, le premier champ de l'index doit être utilisé comme condition pour garantir que le système utilise l'index, sinon l'index le fera. not ne sera pas utilisé et l'ordre des champs doit être autant que possible cohérent avec l'ordre de l'index.

12. N'écrivez pas de requêtes dénuées de sens. Par exemple, si vous devez générer une structure de table vide :
sélectionnez col1,col2 dans #t à partir de t où 1=0
Ce type de. le code ne renverra rien. Le jeu de résultats, mais il consommera des ressources système, doit être modifié comme suit :
create table #t(…)

13. est un bon choix :
sélectionnez num depuis a où num in(select num from b)
Remplacez par l'instruction suivante :
sélectionnez num depuis a où existe (sélectionnez 1 depuis b où num=a.num )

14. Tous les index ne sont pas efficaces pour les requêtes. SQL optimise les requêtes en fonction des données de la table lorsqu'il y a une grande quantité de données en double dans la colonne d'index, la requête SQL peut ne pas utiliser l'index. Par exemple, il y a un champ sexe dans une table, les hommes et les femmes sont presque différents, alors même si un index est construit sur le sexe, cela n'aura aucun effet sur l'efficacité des requêtes.

15. Plus il y a d'index, mieux c'est. Bien que l'index puisse améliorer l'efficacité de la sélection correspondante, il réduit également l'efficacité de l'insertion et de la mise à jour, car l'index peut être reconstruit lors de l'insertion ou de la mise à jour, alors comment construire le un index est requis A considérer attentivement et au cas par cas. Il est préférable de ne pas avoir plus de 6 index sur une table. S'il y en a trop, vous devez vous demander s'il est nécessaire de créer des index sur certaines colonnes qui ne sont pas couramment utilisées.

16. Vous devez éviter de mettre à jour les colonnes de données d'index clusterisées autant que possible, car l'ordre des colonnes de données d'index cluster est l'ordre de stockage physique des enregistrements de la table. l'ensemble de l'enregistrement de la table sera affecté. L'ajustement de l'ordre consommera des ressources considérables. Si le système d'application doit mettre à jour fréquemment les colonnes de données de l'index clusterisé, vous devez alors déterminer si l'index doit être construit en tant qu'index clusterisé.

17. Essayez d'utiliser des champs numériques. Si les champs contiennent uniquement des informations numériques, essayez de ne pas les concevoir comme des champs de caractères. Cela réduira les performances des requêtes et des connexions et augmentera la surcharge de stockage. En effet, le moteur comparera chaque caractère de la chaîne un par un lors du traitement des requêtes et des connexions, et une seule comparaison suffit pour les types numériques.

18. Utilisez autant que possible varchar/nvarchar au lieu de char/nchar, car tout d'abord, les champs de longueur variable ont un petit espace de stockage et peuvent économiser de l'espace de stockage. Deuxièmement, pour les requêtes, l'efficacité de la recherche est relativement grande. le petit champ est évidemment plus élevé.

19. N'utilisez select * from t nulle part, remplacez "*" par une liste de champs spécifique et ne renvoyez aucun champ inutilisé.

20. Essayez d'utiliser des variables de table au lieu de tables temporaires. Si la variable de table contient une grande quantité de données, sachez que les index sont très limités (uniquement les index de clé primaire).

21. Évitez de créer et de supprimer fréquemment des tables temporaires pour réduire la consommation des ressources des tables système.

22. Les tables temporaires ne sont pas inutilisables. Leur utilisation appropriée peut rendre certaines routines plus efficaces, par exemple, lorsque vous devez référencer à plusieurs reprises une grande table ou une table fréquemment utilisée . ensemble de données. Cependant, pour les événements ponctuels, il est préférable d'utiliser une table d'exportation.

23. Lors de la création d'une table temporaire, si la quantité de données insérée en même temps est importante, vous pouvez utiliser select into au lieu de create table pour éviter qu'un grand nombre de journaux n'augmentent la vitesse. ; si la quantité de données n'est pas grande. Afin d'alléger les ressources de la table système, vous devez d'abord créer la table, puis l'insérer.

24. Si des tables temporaires sont utilisées, toutes les tables temporaires doivent être explicitement supprimées à la fin de la

procédure stockée Tout d'abord, tronquez la table, puis supprimez-la. la table système d'être dépassée verrouillée pendant une longue période.

25. Essayez d'éviter

d'utiliser des curseurs, car les curseurs sont moins efficaces si les données de opération du curseur dépassent 10 000 lignes, alors vous devriez envisager de les réécrire.

26. Avant d'utiliser la méthode basée sur le curseur ou la méthode de table temporaire, vous devez d'abord rechercher une solution basée sur un ensemble pour résoudre le problème. La méthode basée sur un ensemble est généralement plus efficace.

27. Comme les tables temporaires, les curseurs ne sont pas inutilisables. L'utilisation du curseur FAST_

FORWARD pour de petits ensembles de données est souvent supérieure aux autres méthodes de traitement ligne par ligne, en particulier lorsque plusieurs tables doivent être référencées pour obtenir les données requises. Les routines qui incluent des « totaux » dans un jeu de résultats sont généralement plus rapides que l'utilisation d'un curseur. Si le temps de développement le permet, vous pouvez essayer à la fois la méthode basée sur le curseur et la méthode basée sur les ensembles pour voir quelle méthode fonctionne le mieux.

28. Définissez SET NO

COUNT ON au début de toutes les procédures stockées et déclencheurs , et définissez SET NOCOUNT OFF à la fin. Il n'est pas nécessaire d'envoyer un message DONE_IN_PROC au client après chaque instruction de procédures stockées et de déclencheurs.

29. Essayez d'éviter de renvoyer de grandes quantités de données au client. Si la quantité de données est trop importante, vous devez vous demander si les exigences correspondantes sont raisonnables.

30. Essayez d'éviter les

opérations de transaction volumineuses pour améliorer la simultanéité du système.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn