Maison >développement back-end >tutoriel php >Résumé des expressions régulières PHP et des annotations grammaticales couramment utilisées
Syntaxe de base
Délimiteur :
identifie le début et la fin d'une expression régulière, utilisez '/' ou ' #' ou '{ }', car la syntaxe '{ }' peut également être un opérateur d'expression régulière, pour éviter toute confusion, il n'est pas recommandé de l'utiliser. L'utilisation recommandée est la suivante :
Copy$pattern = '/[0-9]/'; //我喜欢这个,看起来比较简洁 $pattern = '#[0-9]#';
Atomes :
Atomes visibles : caractères de la table d'encodage Unicode visibles à l'œil nu après une sortie au clavier, par exemple : Ponctuation ; / Ou des caractères visibles tels que des lettres anglaises, des caractères chinois, etc.
Atomes invisibles : caractères de la table de codage Unicode qui sont invisibles à l'œil nu après une sortie au clavier, tels que : nouvelle ligne n, Tab t, espace, etc. ,
Généralement, seuls ces trois caractères sont utilisés (les caractères de nouvelle ligne sont généralement mis en correspondance avec d'autres caractères, car seuls les caractères de nouvelle ligne ne peuvent pas correspondre)
Conseils : vous devez ajouter ' ' avant l'opérateur de correspondance. Par exemple : signe '+', en cas de correspondance, vous devez écrire '+'
métacaractères
Méthode de filtrage atomique :
| Faire correspondre deux ou plusieurs sélections de branches
[] correspond à n'importe quel atome entre crochets
[^] correspond à n'importe quel caractère à l'exception des atomes entre crochets
Exemple : Duang| duang ou [Dd]uang Les deux peuvent correspondre à Duang et duang
écriture à intervalles : [a-z] correspond aux caractères de a à z, [0-9] correspond aux caractères de 0 à 9. Il peut également s'agir de [a-z0-9]
Correspond à n'importe quel caractère, à l'exception du caractère de nouvelle ligne
d correspond à n'importe quel chiffre décimal, c'est-à-dire que {0-9]
D correspond à n'importe quel chiffre non décimal [^. 0-9] équivaut à [^d]
s correspondant à un atome invisible, c'est-à-dire [fnrtv]
S correspond à un atome visible, c'est-à-dire [fnrtv], équivalent à [s]z
w Correspond à n'importe quel chiffre, lettre ou trait de soulignement, c'est-à-dire [0-9a-zA-Z_]
W correspond à n'importe quel autre chiffre, lettre ou trait de soulignement, [0-9a-zA-Z_], ce qui équivaut à [w]
Quantificateur
{n} signifie que l'atome devant lui apparaît exactement n fois.
[n] signifie que l'atome précédent apparaît au moins n fois
{n,m} apparaît au moins n fois et au plus m fois
* correspond à 0 fois, une ou plusieurs fois, c'est-à-dire, {0,}
+ correspond à une ou plusieurs fois, c'est-à-dire {1,}
? Correspond à 0 ou 1 fois, c'est-à-dire {0,1}
Contrôle des frontières
^ correspond à la position de départ de la chaîne
$ correspond à la position de fin de la chaîne
Exemple : ^John peut correspondre à : John mais ne peut pas correspondre à : 123John, car la chaîne est spécifié pour commencer par John Commençant par
unité de modèle
() correspond à la partie entière en tant qu'atome, tel que : (X|x)iaomi , qui peut correspondre à xiaomi
Mode de correction
Correspondance gourmande
Lorsque le résultat de la correspondance est ambigu, prenez le plus long (par défaut)
Correspondance paresseuse
Lorsque le résultat de la correspondance est ambigu, choisissez le plus court, ajoutez simplement 'U' après '/' dans l'expression régulière, pour exemple '/[0-9]/U';
Exemple :
Copy$subject = "test__123123123"; preg_match('/test.+123/', $subject, $matches); //贪婪模式 var_dump($matches); preg_match('/test.+123/U', $subject, $matches); //懒惰模式var_dump($matches);
Modèles de correction courants :
U Correspondance paresseuse
i Ignorer la casse des lettres anglaises
x Ignorer les caractères d'espacement dans les expressions régulières
s Laisser le métacaractère '.' correspondre à tous les caractères, y compris les nouvelles lignes
Fonctions communes
preg_match
sont exécutés Match Regular Expression
preg_match ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]] ) : int
pattern : modèle à rechercher, type de chaîne. sujet : chaîne d'entrée. match : si le paramètre matches est fourni, il sera rempli avec les résultats de la recherche et la structure des données est un tableau unidimensionnel. flags : peut être défini sur PREG_OFFSET_CAPTURE, en utilisant le 0ème élément du résultat de la recherche comme chaîne correspondante et le 1er élément comme décalage (position) correspondant. offset : La recherche commence à partir de la position de départ de la chaîne cible.
Valeur de retour : nombre de correspondances
Similaire à la fonction preg_match_all, les paramètres sont cohérents avec preg_match
Différence :
preg_match : ne correspond qu'une seule fois, le résultat des données de la recherche la structure de correspondance est un tableau unidimensionnel preg_match_all : Correspond à tout, la structure de données de la correspondance des résultats de recherche est un tableau à deux dimensions.
preg_replace
Effectue une recherche et un remplacement d'expression régulière, et la valeur de retour est la chaîne remplacée
preg_replace ( mixed $pattern , mixed $replacement , mixed $subject [, int $limit = -1 [, int &$count ]] ) : mixed
pattern : le modèle à rechercher. Peut être une chaîne ou un tableau de chaînes. remplacement : une chaîne ou un tableau de chaînes utilisé pour le remplacement. sujet : une chaîne ou un tableau de chaînes à rechercher et à remplacer. limite : le nombre maximum de remplacements. La valeur par défaut est -1 (illimité). count : nombre de remplacements.
Similaire à la fonction preg_filter, les paramètres sont les mêmes que preg_replace
Différences (la différence ne peut être vue qu'en utilisant des tableaux pour la correspondance) : preg_replace : renvoie tous les résultats, qu'il y ait remplacement ou non. preg_filter : uniquement renvoie des résultats correspondants.
preg_split
Séparer les chaînes par une expression régulière
preg_split ( string $pattern , string $subject [, int $limit = -1 [, int $flags = 0 ]] ) : array
$pattrn:用于搜索的模式,字符串形式。subject:输入字符串limit:将限制分隔得到的子串最多只有limit个,返回的最后一个 子串将包含所有剩余部分。flags:有以下标记的组合:
-- 1. PREG_SPLIT_NO_EMPTY: 返回分隔后的非空部分。
-- 2. PREG_SPLIT_DELIM_CAPTURE: 用分隔符'()'括号把匹配的捕获并返回。
-- 3. PREG_SPLIT_OFFSET_CAPTURE: 匹配返回时将会附加字符串偏移量
PREG_SPLIT_DELIM_CAPTURE这个参数可能比较难明白,举个例子看看:
Copy$subject = "1a23b"; $a = preg_split('/[\d]/', $subject, -1, PREG_SPLIT_NO_EMPTY); var_dump($a); $a = preg_split('/([\d])/', $subject, -1, PREG_SPLIT_NO_EMPTY | PREG_SPLIT_DELIM_CAPTURE); var_dump($a);
输出如下:
array (size=2)
0 => string 'a' (length=1)
1 => string 'b' (length=1)
array (size=5)
0 => string '1' (length=1)
1 => string 'a' (length=1)
2 => string '2' (length=1)
3 => string '3' (length=1)
4 => string 'b' (length=1)
preg_grep
返回匹配模式的数组条目
preg_grep ( string $pattern , array $input [, int $flags = 0 ] ) : array
$pattern:要搜索的模式,字符串形式$input:输入数组flags:如果不设置则返回匹配的数目,设置PREG_GREP_INVERT则返回不匹配的数目。
preg_quote
转义正则表达式字符,返回为转义后的字符串
preg_quote ( string $str [, string $delimiter = NULL ] ) : string
str:输入字符串delimiter:需要转义的字符串
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!