Maison  >  Article  >  base de données  >  Explication détaillée des techniques d'optimisation des requêtes SQL pour MySQL pour des dizaines de millions de Big Data

Explication détaillée des techniques d'optimisation des requêtes SQL pour MySQL pour des dizaines de millions de Big Data

藏色散人
藏色散人avant
2019-12-21 17:53:482525parcourir

Explication détaillée des techniques d'optimisation des requêtes SQL pour MySQL pour des dizaines de millions de Big Data

1. Pour optimiser la requête, essayez d'éviter les analyses de table complètes. Pensez d'abord à créer des index sur les colonnes impliquées dans Where et à trier par.

2. Essayez d'éviter de porter des jugements de valeur nulle sur les champs de la clause Where, sinon le moteur abandonnera l'utilisation de l'index et effectuera une analyse complète de la table, par exemple : sélectionnez l'identifiant à partir de t où num est nul. be on num Définissez la valeur par défaut 0, assurez-vous qu'il n'y a pas de valeur nulle dans la colonne num du tableau, puis interrogez comme ceci : select id from t Where num=0

3 Essayez d'éviter d'utiliser. != ou <> dans l'opérateur de la clause Where, sinon le moteur abandonnera l'utilisation de l'index et effectuera une analyse complète de la table.

4. Essayez d'éviter d'utiliser ou dans la clause Where pour connecter les conditions, sinon le moteur abandonnera l'utilisation de l'index et effectuera une analyse complète de la table, telle que : sélectionnez l'identifiant à partir de t où num=10 ou num =20 OK Requête comme ceci : select id from t Where num=10 union all select id from t Where num=20

5.in et not in doit également être utilisé avec prudence, sinon cela entraînera un analyse complète de la table, telle que : sélectionnez l'identifiant à partir de t où num in(1,2,3) Pour les valeurs continues, n'utilisez pas in si vous pouvez utiliser entre : sélectionnez l'identifiant à partir de t où num entre 1 et 3

6. La requête suivante entraînera également l'analyse de toutes les tables : sélectionnez l'identifiant à partir de t où le nom ressemble à '%李%' Pour améliorer l'efficacité, vous pouvez envisager une recherche en texte intégral.

7. Si des paramètres sont utilisés dans la clause Where, cela entraînera également une analyse complète de la table. Étant donné que SQL résout les variables locales uniquement au moment de l'exécution, l'optimiseur ne peut pas différer la sélection d'un plan d'accès jusqu'au moment de l'exécution ; il doit effectuer la sélection au moment de la compilation ; Cependant, si le plan d'accès est construit au moment de la compilation, la valeur de la variable est toujours inconnue et ne peut pas être utilisée comme entrée pour la sélection d'index. Par exemple, l'instruction suivante effectuera une analyse complète de la table : select id from t which num=@num peut être modifié pour forcer la requête à utiliser l'index : select id from t with(index(index name))where num=@ num

8 . Vous devez essayer d'éviter d'effectuer des opérations d'expression sur les champs de la clause Where, ce qui entraînerait l'abandon du moteur par l'utilisation de l'index et une analyse complète de la table. Par exemple : sélectionnez l'identifiant à partir de t où num/2=100 doit être remplacé par : sélectionnez l'identifiant à partir de t où num=100*2.

9. Essayez d'éviter d'effectuer des opérations fonctionnelles sur les champs de la clause Where, ce qui amènerait le moteur à abandonner l'utilisation de l'index et à effectuer une analyse complète de la table. Par exemple : sélectionnez l'identifiant à partir de t où substring(name,1,3)='abc', l'identifiant dont le nom commence par abc doit être remplacé par : sélectionnez l'identifiant à partir de t où le nom ressemble à "abc%".

10. N'effectuez pas de fonctions, d'opérations arithmétiques ou d'autres opérations d'expression sur le côté gauche de "=" dans la clause Where, sinon le système pourrait ne pas être en mesure d'utiliser l'index correctement.

11. Lors de l'utilisation d'un champ d'index comme condition, si l'index est un index composite, le premier champ de l'index doit être utilisé comme condition pour garantir que le système utilise l'index, sinon l'index le fera. not ne sera pas utilisé et l'ordre des champs doit être autant que possible cohérent avec l'ordre de l'index.

12. N'écrivez pas de requêtes dénuées de sens. Par exemple, si vous devez générer une structure de table vide : sélectionnez col1,col2 dans #t à partir de t où 1=0, ce type de code ne renverra aucune requête. ensemble de résultats, mais ce sera le cas. S'il consomme des ressources système, il doit être modifié comme suit : créer une table #t(…).

13. Plusieurs fois, c'est un bon choix d'utiliser exist au lieu de in : select num from awhere num in(select num from b), remplacez-le par l'instruction suivante : select num from awhere exist( sélectionnez 1 parmi b où num=a.num).

14. Tous les index ne sont pas efficaces pour les requêtes. SQL optimise les requêtes en fonction des données de la table. Lorsqu'il y a une grande quantité de données en double dans la colonne d'index, la requête SQL peut ne pas utiliser l'index. comme dans une table Il y a un champ sexe, presque moitié homme et moitié femme, donc même si un index est construit sur le sexe, cela n'aura aucun effet sur l'efficacité des requêtes.

15. Plus il y a d'index, mieux c'est. Bien que l'index puisse améliorer l'efficacité de la sélection correspondante, il réduit également l'efficacité de l'insertion et de la mise à jour, car l'index peut être reconstruit lors de l'insertion ou de la mise à jour, et alors. ? L'indexation nécessite un examen attentif et dépendra des circonstances. Il est préférable de ne pas avoir plus de 6 index sur une table. S'il y en a trop, vous devez vous demander s'il est nécessaire de créer des index sur certaines colonnes qui ne sont pas couramment utilisées.

16. Vous devez éviter autant que possible de mettre à jour les colonnes de données d'index cluster, car l'ordre des colonnes de données d'index cluster est l'ordre de stockage physique des enregistrements de la table. Une fois la valeur de la colonne modifiée, l'ordre de la table entière. les dossiers seront ajustés. Cela consomme des ressources considérables. Si le système d'application doit mettre à jour fréquemment les colonnes de données de l'index clusterisé, vous devez alors déterminer si l'index doit être construit en tant qu'index clusterisé.

17. Utilisez autant que possible des champs numériques. Si les champs contiennent uniquement des informations numériques, essayez de ne pas les concevoir comme des champs de caractères. Cela réduira les performances des requêtes et des connexions et augmentera la surcharge de stockage. En effet, le moteur comparera chaque caractère de la chaîne un par un lors du traitement des requêtes et des connexions, et une seule comparaison suffit pour les types numériques.

18. Utilisez autant que possible varchar/nvarchar au lieu de char/nchar, car tout d'abord, les champs de longueur variable ont un petit espace de stockage et peuvent économiser de l'espace de stockage. Deuxièmement, pour les requêtes, l'efficacité de la recherche est relativement grande. le petit champ est évidemment plus élevé.

19. N'utilisez select * from t nulle part, remplacez "*" par une liste de champs spécifique et ne renvoyez aucun champ inutilisé.

20. Essayez d'utiliser des variables de table au lieu de tables temporaires. Si la variable de table contient une grande quantité de données, sachez que les index sont très limités (uniquement les index de clé primaire).

21. Évitez de créer et de supprimer fréquemment des tables temporaires pour réduire la consommation des ressources des tables système.

22. Les tables temporaires ne sont pas inutilisables et leur utilisation appropriée peut rendre certaines routines plus efficaces, par exemple lorsque vous devez référencer à plusieurs reprises une grande table ou un certain ensemble de données dans une table couramment utilisée. Toutefois, pour des événements ponctuels, il est préférable d'utiliser une table d'export.

23. Lors de la création d'une table temporaire, si la quantité de données insérées en même temps est importante, vous pouvez utiliser select into au lieu de create table pour éviter d'augmenter la vitesse d'un grand nombre de journaux ; Les données ne sont pas volumineuses, afin de faciliter le système. Pour les ressources de table, vous devez d'abord créer la table puis l'insérer.

24. Si des tables temporaires sont utilisées, toutes les tables temporaires doivent être explicitement supprimées à la fin de la procédure stockée. Commencez par tronquer la table, puis supprimez-la, afin d'éviter un verrouillage prolongé des tables système.

25. Essayez d'éviter d'utiliser des curseurs, car les curseurs sont moins efficaces si les données exploitées par le curseur dépassent 10 000 lignes, vous devriez envisager de les réécrire.

26. Avant d'utiliser la méthode basée sur le curseur ou la méthode de table temporaire, vous devez d'abord rechercher une solution basée sur un ensemble pour résoudre le problème. La méthode basée sur un ensemble est généralement plus efficace.

27. Comme les tables temporaires, les curseurs ne sont pas inutilisables. L'utilisation de curseurs FAST_FORWARD avec de petits ensembles de données est souvent meilleure que d'autres méthodes de traitement ligne par ligne, en particulier lorsque plusieurs tables doivent être référencées pour obtenir les données requises. Les routines qui incluent des « totaux » dans un jeu de résultats sont généralement plus rapides que l'utilisation d'un curseur. Si le temps de développement le permet, vous pouvez essayer à la fois la méthode basée sur le curseur et la méthode basée sur les ensembles pour voir quelle méthode fonctionne le mieux.

28. Définissez SET NOCOUNT ON au début de toutes les procédures stockées et déclencheurs, et définissez SET NOCOUNT OFF à la fin. Il n'est pas nécessaire d'envoyer un message DONE_IN_PROC au client après chaque instruction de procédures stockées et de déclencheurs.

29. Essayez d'éviter les opérations de transactions volumineuses et d'améliorer la simultanéité du système.

30. Essayez d'éviter de renvoyer de grandes quantités de données au client. Si la quantité de données est trop importante, vous devez vous demander si les exigences correspondantes sont raisonnables.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer