Maison  >  Article  >  développement back-end  >  Résumé des caractères d'expression régulière

Résumé des caractères d'expression régulière

小云云
小云云original
2018-02-22 13:14:031456parcourir

L'expression régulière de base

correspond à un seul caractère

correspond à un seul nombre, qui peut être "[0-9]" ou "d".

correspond à un seul caractère non numérique , puis utilisez "D" majuscule.

correspond à n'importe lequel des 26 lettres , utilisez "[a-zA-Z]"

pour correspondre à n'importe quel caractère, utilisez le point "."

Si vous correspondez à des caractères spécifiques, écrivez-les simplement directement. Par exemple, "abcd" correspond à lui-même. Si vous rencontrez des caractères spéciaux, vous devez vous échapper , et le caractère d'échappement est "".

correspond à un caractère. L'utilisation de crochets est appelée un "jeu de caractères". Les crochets sont utilisés pour spécifier un "ensemble", correspondant à un caractère de cet ensemble, tel que le nombre hexadécimal "[0-9a-fA-F]". Le point dans le jeu de caractères représente le point lui-même , mais d'autres caractères spéciaux doivent encore être transférés, tels que les caractères antislash.

Utiliser des quantificateurs

Correspondance gourmande

Si vous souhaitez exprimer la répétition d'une règle, vous devez utiliser des quantificateurs. Utilisez des accolades pour indiquer le nombre de répétitions. Par exemple, 8 nombres peuvent être exprimés comme ceci : "d{8}"

Les quantificateurs entre accolades peuvent être modifiés. Par exemple, pour exprimer 7 à 8 nombres, il s'exprime comme "d{7,8}. ". La rvalue représentant la limite supérieure n'a pas besoin d'être écrite. Par exemple, "{0,}" est légal, indiquant qu'elle est supérieure ou égale à 0 caractère mais "{,10}" qui tente d'exprimer seule la limite supérieure ; n'est pas légal et devrait au moins être écrit comme "{0,10}" .

Le signe plus « + » indique que le nombre d'éléments à sa gauche est « un ou plusieurs », ce qui est égal à l'effet de « {1,} ». Le signe plus est donc aussi un caractère spécial.

L'astérisque « * » signifie que le nombre d'éléments à sa gauche est « zéro ou au moins un », c'est-à-dire « {0,} ».

Le point d'interrogation « ? » signifie « zéro ou un » et équivaut à « {0,1} ».

Correspondance paresseuse

Pour ce qui précède, comme + et *, le modèle "gourmand" sera utilisé lors de la correspondance, c'est-à-dire la correspondance comme autant d'articles que possible. Par exemple, lorsque vous utilisez "5+" pour faire correspondre la chaîne "55555", il correspondra à la chaîne la plus longue qu'il puisse trouver, qui est "55555".

Si vous ajoutez un point d'interrogation après le quantificateur, le modèle correspondant devient "paresseux", c'est-à-dire celui avec le moins de correspondance. Par exemple, si vous utilisez "5+?" pour faire la correspondance, vous ne trouverez que le plus petit caractère correspondant "5".

Les expressions de correspondance paresseuse suivantes sont disponibles : +?, *?, , {n,}?{m,n}?

Capturer le regroupement (similaire à la définition d'une macro)

peut

"capturer" une partie de l'expression et la référencer plus tard en tant que macro. Utilisez crochets pour définir (capturer), puis utilisez "" après la définition pour référencer ; s'il s'agit de la deuxième capture, utilisez "1", et ainsi de suite. 2

Les groupes sont généralement sauvegardés, mais lorsque l'expression est très longue, il peut être nécessaire d'indiquer explicitement de ne pas sauvegarder le groupe. Par exemple, si vous utilisez ce format «

», vous utilisez l'étiquette « (?:THE|The|the) » pour indiquer qu'aucune balise de nom n'est requise. ?:

Logique « OU »

Utilisez «

» pour lier deux champs, fournissant ainsi une logique « OU ». Notez qu'il est utilisé avec des parenthèses |

"pas" logique

Si le caractère "

" est utilisé dans l'ensemble "[...]", cela signifie "non", comme "^" Équivalent à "[^0-9]". D

Résumé des caractères d'expression régulière

Correspondance de modèles simples

Ce qui suit est une liste de correspondances de caractères uniques couramment utilisées :

Chiffres
Type de référence Modèle Remarques
指代类型 模式 备注
数字 d
字母、数字、下划线 w 等效于 “[_a-zA-Z0-9]
非数字 D
非字母 W
制表符 Tab t
Null 字符

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn