Maison >base de données >tutoriel mysql >Résumez quelques vitesses de requête optimisées lorsque MySQL traite de nombreuses données
Récemment, en raison de besoins professionnels, j'ai commencé à prêter attention aux méthodes d'optimisation associées des instructions de requête sélectionnées pour la base de données Mysql. Les amis qui en ont besoin peuvent s'y référer
En raison du projet auquel j'ai participé. dans, j'ai découvert que la quantité de données dans la table mysql Lorsqu'elle atteint le niveau du million, l'efficacité des requêtes SQL ordinaires chute, et s'il existe de nombreuses conditions de requête dans lesquelles, la vitesse de requête est tout simplement intolérable. Une fois, j'ai testé une requête conditionnelle sur une table contenant plus de 4 millions d'enregistrements (avec index), et le temps de requête atteignait 40 secondes. Je pense qu'un délai de requête aussi élevé rendrait fou n'importe quel utilisateur. Par conséquent, il est très important de savoir comment améliorer l’efficacité des requêtes d’instructions SQL. Voici 30 méthodes d'optimisation des instructions de requête SQL largement diffusées sur Internet :
1. Essayez d'éviter d'utiliser les opérateurs != ou a8093152e673feb7aba1828c43532094 indexer et poursuivre l'analyse complète de la table.
2. Pour optimiser la requête, essayez d'éviter les analyses de table complètes. Tout d'abord, pensez à créer des index sur les colonnes impliquées dans Where et à trier par.
3. Essayez d'éviter de juger la valeur nulle des champs dans la clause Where, sinon le moteur abandonnera l'utilisation de l'index et effectuera une analyse complète de la table, telle que :
select id from t where num is null
Vous pouvez définir la valeur par défaut 0 sur num, vous assurer qu'il n'y a pas de valeur nulle dans la colonne num du tableau, puis interroger comme ceci :
select id from t where num=0
4. évitez d'utiliser ou dans la clause Where pour connecter les conditions, sinon le moteur abandonnera l'utilisation de l'index et effectuera une analyse complète de la table, telle que :
select id from t where num=10 or num=20
peut être interrogé comme ceci :
select id from t where num=10 union all select id from t where num=20
5. La requête suivante entraînera également une analyse complète de la table : (ne peut pas précéder le signe de pourcentage)
select id from t where name like ‘�c%'
Pour améliorer l'efficacité , vous pouvez envisager une recherche en texte intégral.
6. In et not in doivent également être utilisés avec prudence, sinon cela entraînera une analyse complète du tableau, comme :
select id from t where num in(1,2,3)
Pour les valeurs continues , vous pouvez utiliser entre Ne pas utiliser dans :
select id from t where num between 1 and 3
7. Si des paramètres sont utilisés dans la clause Where, cela entraînera également une analyse complète de la table. Étant donné que SQL résout les variables locales uniquement au moment de l'exécution, l'optimiseur ne peut pas différer la sélection d'un plan d'accès jusqu'au moment de l'exécution ; il doit effectuer la sélection au moment de la compilation ; Cependant, si le plan d'accès est créé au moment de la compilation, les valeurs des variables sont toujours inconnues et ne peuvent pas être utilisées comme entrée pour la sélection d'index. Par exemple, l'instruction suivante effectuera une analyse complète de la table :
select id from t where num=@num
peut être modifiée pour forcer la requête à utiliser un index :
select id from t with(index(索引名)) where num=@num
8 . Essayez d'éviter les clauses Where Effectuer des opérations d'expression sur les champs, ce qui obligerait le moteur à abandonner l'utilisation de l'index et à effectuer une analyse complète de la table. Par exemple :
select id from t where num/2=100 应改为: select id from t where num=100*2
9. Essayez d'éviter d'effectuer des opérations de fonction sur les champs de la clause Where, ce qui amènerait le moteur à abandonner l'utilisation de l'index et à effectuer une analyse complète de la table. Par exemple :
select id from t where substring(name,1,3)='abc'–name以abc开头的id select id from t where datediff(day,createdate,'2005-11-30′)=0–'2005-11-30′生成的id 应改为: select id from t where name like ‘abc%' select id from t where createdate>='2005-11-30′ and createdate<'2005-12-1′
10. N'effectuez pas de fonctions, d'opérations arithmétiques ou d'autres opérations d'expression sur le côté gauche de "=" dans la clause Where, sinon le système pourrait ne pas pouvoir utiliser l'index correctement.
11. Lors de l'utilisation d'un champ d'index comme condition, si l'index est un index composite, le premier champ de l'index doit être utilisé comme condition pour garantir que le système utilise l'index, sinon l'index le fera. not ne sera pas utilisé et l'ordre des champs doit être autant que possible cohérent avec l'ordre de l'index.
12. N'écrivez pas de requêtes dénuées de sens. Par exemple, si vous devez générer une structure de table vide :
sélectionnez col1,col2 dans #t à partir de t où 1=0
Ce type de. le code ne renverra rien. Le jeu de résultats, mais il consommera des ressources système, doit être modifié comme suit :
create table #t(…)
13. Dans de nombreux cas, utiliser exist au lieu de in est un bon choix. :
select num from a where num in(select num from b) 用下面的语句替换: select num from a where exists(select 1 from b where num=a.num)
14. Tous les index ne sont pas valides pour les requêtes. SQL optimise les requêtes en fonction des données de la table lorsqu'il y a une grande quantité de données en double dans la colonne d'index. La requête ne peut pas utiliser l'index. Par exemple, il y a un champ sexe dans une table, les hommes et les femmes sont presque la moitié chacun, donc même si un index est construit sur le sexe, cela n'aura aucun effet sur l'efficacité de la requête.
15. Plus il y a d'index, mieux c'est. Bien que l'index puisse améliorer l'efficacité de la sélection correspondante, il réduit également l'efficacité de l'insertion et de la mise à jour, car l'index peut être reconstruit lors de l'insertion ou de la mise à jour, et alors. ? L'indexation nécessite un examen attentif et dépendra des circonstances. Il est préférable de ne pas avoir plus de 6 index sur une table. S'il y en a trop, vous devez vous demander s'il est nécessaire de créer des index sur certaines colonnes qui ne sont pas couramment utilisées.
16. Vous devez éviter autant que possible de mettre à jour les colonnes de données d'index cluster, car l'ordre des colonnes de données d'index cluster est l'ordre de stockage physique des enregistrements de la table. Une fois la valeur de la colonne modifiée, l'ordre de la table entière. les dossiers seront ajustés. Cela consomme des ressources considérables. Si le système d'application doit mettre à jour fréquemment les colonnes de données de l'index clusterisé, vous devez alors déterminer si l'index doit être construit en tant qu'index clusterisé.
17. Essayez d'utiliser des champs numériques. Si les champs contiennent uniquement des informations numériques, essayez de ne pas les concevoir comme des champs de caractères. Cela réduira les performances des requêtes et des connexions et augmentera la surcharge de stockage. En effet, le moteur comparera chaque caractère de la chaîne un par un lors du traitement des requêtes et des connexions, et une seule comparaison suffit pour les types numériques.
18. Utilisez autant que possible varchar/nvarchar au lieu de char/nchar, car tout d'abord, les champs de longueur variable ont un petit espace de stockage et peuvent économiser de l'espace de stockage. Deuxièmement, pour les requêtes, l'efficacité de la recherche est relativement grande. le petit champ est évidemment plus élevé.
19. N'utilisez select * from t nulle part, remplacez "*" par une liste de champs spécifique et ne renvoyez aucun champ inutilisé.
20. Essayez d'utiliser des variables de table au lieu de tables temporaires. Si la variable de table contient une grande quantité de données, sachez que les index sont très limités (uniquement les index de clé primaire).
21. Évitez de créer et de supprimer fréquemment des tables temporaires pour réduire la consommation des ressources des tables système.
22. Les tables temporaires ne sont pas inutilisables. Leur utilisation appropriée peut rendre certaines routines plus efficaces, par exemple lorsque vous devez référencer à plusieurs reprises une grande table ou un certain ensemble de données dans une table couramment utilisée. Cependant, pour les événements ponctuels, il est préférable d'utiliser des tables d'export.
23. Lors de la création d'une table temporaire, si la quantité de données insérées en même temps est importante, vous pouvez utiliser select into au lieu de create table pour éviter d'augmenter la vitesse d'un grand nombre de journaux ; Les données ne sont pas volumineuses, afin de faciliter le système. Pour les ressources de table, vous devez d'abord créer la table puis l'insérer.
24. Si des tables temporaires sont utilisées, toutes les tables temporaires doivent être explicitement supprimées à la fin de la procédure stockée. Commencez par tronquer la table, puis supprimez-la. Cela peut éviter un verrouillage de longue durée des tables système.
25. Essayez d'éviter d'utiliser des curseurs, car les curseurs sont moins efficaces si les données exploitées par le curseur dépassent 10 000 lignes, alors vous devriez envisager de réécrire.
26. Avant d'utiliser la méthode basée sur le curseur ou la méthode de table temporaire, vous devez d'abord rechercher une solution basée sur un ensemble pour résoudre le problème. La méthode basée sur un ensemble est généralement plus efficace.
27. Comme les tables temporaires, les curseurs ne sont pas inutilisables. L'utilisation de curseurs FAST_FORWARD avec de petits ensembles de données est souvent meilleure que d'autres méthodes de traitement ligne par ligne, en particulier lorsque plusieurs tables doivent être référencées pour obtenir les données requises. Les routines qui incluent des « totaux » dans un jeu de résultats sont généralement plus rapides que l'utilisation d'un curseur. Si le temps de développement le permet, vous pouvez essayer à la fois la méthode basée sur le curseur et la méthode basée sur les ensembles pour voir quelle méthode fonctionne le mieux.
28. Définissez SET NOCOUNT ON au début de toutes les procédures stockées et déclencheurs, et définissez SET NOCOUNT OFF à la fin. Il n'est pas nécessaire d'envoyer un message DONE_IN_PROC au client après chaque instruction de procédures stockées et de déclencheurs.
29. Essayez d'éviter de renvoyer de grandes quantités de données au client. Si la quantité de données est trop importante, vous devez vous demander si les exigences correspondantes sont raisonnables.
30. Essayez d'éviter les opérations de transactions volumineuses et d'améliorer la simultanéité du système.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!