Heim >Backend-Entwicklung >PHP-Tutorial >Regelmäßige PHP PCRE-Analyse

Regelmäßige PHP PCRE-Analyse

little bottle
little bottlenach vorne
2019-04-25 17:41:383004Durchsuche

Der Hauptinhalt dieses Artikels befasst sich mit der regelmäßigen PCRE-Analyse von PHP, die einen gewissen Referenzwert hat. Interessierte Freunde können mehr darüber erfahren und hoffen, dass sie Ihnen helfen können.

1. Vorwort

Im vorherigen Blog gibt es eine Analyse des Zeichensatzes. Dabei geht es nicht um den Zeichensatz. Viele Funktionen in PHP verarbeiten standardmäßig das UTF-8-Kodierungsformat in Unicode. Kommen wir also ohne weitere Umschweife direkt zur Sache.

2. PHP-Funktion mb_split Analyse

1 <?php
2 $preg_strings = &#39;测、试、一、下&#39;;
3 $preg_str = mb_split(&#39;、&#39;, $preg_strings);
4 print_r($preg_str);

Ergebnis drucken:

Array(
    [0] => 测
    [1] => 试
    [2] => 一
    [3] => 下)

Diese Funktion verwendet standardmäßig die zugrunde liegende Analyse im UTF-8-Kodierungsformat. Die Zeichen $preg_strings werden durch die hexadezimalen Codepunkte von UNICODE mit dem Trennzeichen (,) getrennt.

3. PHP-Funktion preg_split-Analyse

Teilen Sie die Zeichenfolge „Test it“

1 <?php
2 $strings = &#39;测试一下&#39;;
3 $mb_arr = preg_split(&#39;//u&#39;, $strings, -1, PREG_SPLIT_NO_EMPTY);
4 print_r($mb_arr);

Das Druckergebnis ist wie folgt:

Array(
    [0] => 测
    [1] => 试
    [2] => 一
    [3] => 下
)

4 PCRE

In PHP können reguläre Trennzeichen #, %, / usw. sein.

Manchmal stehen hinter einem regulären Ausdruck einige Modifikatoren. Was bedeuten sie also alle?

Zum Beispiel:

%[\x{4e00}-\x{9fa5}]+%u

Der folgende Modifikator u Codetabelle Verwendung Regelmäßiger Abgleich, um dem -Codierungsformat von utf-8 zu entsprechen.

Beispiel 1:

1 <?php
2 $strings = &#39;测试一下&#39;;
3 $is_true = preg_match_all(&#39;%[\x{4e00}-\x{9fa5}]+%u&#39;, $strings, $match);
4 var_dump($is_true);

Das Druckergebnis ist wie folgt:

Array(
    [0] => Array
        (
            [0] => 测试一下
        )
)

Hier [x{4e00}-x{9fa5}]Was bedeutet das?

Im regulären PHP-Code wird x zur Darstellung von Hexadezimalzahlen verwendet.

Chinesischer UNICODE-Codepunkt liegt in 4E00 - 9FFF (hier wird hexadezimal erwähnt)

Also, Die Art und Weise, wie man reguläre Übereinstimmungen schreibt, ist das Intervall [], [x{4E00}-x{9FFF}]

Die Wirkung dieser beiden regulären Ausdrücke Es ist alles das Gleiche.

Verwandte Tutorials: PHP-Video-Tutorial

Das obige ist der detaillierte Inhalt vonRegelmäßige PHP PCRE-Analyse. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:cnblogs.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen