Heim >Backend-Entwicklung >PHP-Tutorial >PHP-Kampf gegen reguläre Ausdrücke: Passende Satzzeichen

PHP-Kampf gegen reguläre Ausdrücke: Passende Satzzeichen

PHPz
PHPzOriginal
2023-06-23 08:03:072380Durchsuche

In der PHP-Programmierung sind reguläre Ausdrücke ein sehr häufig verwendetes Werkzeug, das schnelle und effektive Vergleichs- und Ersetzungsvorgänge für Zeichenfolgen durchführen kann. Satzzeichen sind gängige Zeichenfolgenelemente, die dem Text eine reichhaltige Semantik verleihen können. In diesem Artikel erfahren Sie, wie Sie reguläre Ausdrücke verwenden, um Satzzeichen für eine intelligentere Textverarbeitung abzugleichen.

1. Arten von Satzzeichen

In regulären Ausdrücken sind Satzzeichen kein bestimmtes Konzept oder Typ. Stattdessen bezieht es sich auf verschiedene gängige Sonderzeichen wie Kommas, Punkte, Ausrufezeichen, Fragezeichen, Semikolons usw. Diese Satzzeichen werden häufig in verschiedenen Bereichen wie Linguistik, Literatur und Verlagswesen verwendet.

2. Methoden zum Abgleichen von Satzzeichen

In regulären Ausdrücken können Sie verschiedene Satzzeichen mithilfe von Sonderzeichen oder Metazeichen abgleichen. Im Folgenden sind einige gängige Methoden zum Abgleichen von Satzzeichen aufgeführt:

  1. Übereinstimmung mit allgemeinen Satzzeichen

Allgemeine Satzzeichen beziehen sich auf gängige Symbole wie Kommas, Punkte, Ausrufezeichen, Fragezeichen, Semikolons, Doppelpunkte usw. Sie können eckige Klammern verwenden [], um sie abzugleichen:

preg_match_all('/[,.?!;:]/', $text, $matches);
// 匹配逗号、句号、感叹号、问号、分号、冒号

Verwenden Sie im obigen Code die Funktion preg_match_all und den regulären Ausdruck „/[,.?!;:]/“, um alle Kommas, Punkte, Ausrufezeichen, Fragezeichen, Semikolons usw. abzugleichen Doppelpunkte. Die eckigen Klammern [] stellen einen Zeichensatz dar, der mehrere Zeichen enthält. In regulären Ausdrücken stellt der Punkt ein Platzhalterzeichen für jedes beliebige Zeichen dar und muss als Escapezeichen verwendet werden.

  1. Passende Ellipsen

Eine Ellipse ist ein Symbol, das aus drei aufeinanderfolgenden Punkten besteht. Sie können den regulären Ausdruck „…“ verwenden, um sie abzugleichen:

preg_match_all('/…/', $text, $matches);
// 匹配省略号

Verwenden Sie im obigen Code die Funktion preg_match_all und den regulären Ausdruck „/ …' /', um alle Ellipsen abzugleichen. Der Punkt in den Auslassungspunkten muss als maskiert werden.

  1. Doppelte und einfache Anführungszeichen aufeinander abstimmen

In PHP-Programmen werden häufig doppelte und einfache Anführungszeichen zum Definieren von Zeichenfolgen verwendet, und diese beiden Anführungszeichen sind auch übliche Satzzeichen. Sie können mit eckigen Klammern [] abgeglichen werden:

preg_match_all('/["']/', $text, $matches);
// 匹配双引号和单引号

Im obigen Code werden die Funktion preg_match_all und der reguläre Ausdruck '/["']/' verwendet, um doppelte und einfache Anführungszeichen abzugleichen. Da der reguläre Ausdruck selbst auch verwendet wird Es muss in einfache oder doppelte Anführungszeichen gesetzt werden, daher muss es als ' oder " maskiert werden.

3. Fallanalyse

Um die Methode zur Zuordnung von Satzzeichen besser zu verstehen, wird im Folgenden ein praktischer Fall demonstriert: Zählen, wie oft verschiedene Satzzeichen in einem Text verwendet werden.

Zuerst können wir die in PHP integrierte Funktion file_get_contents verwenden, um eine Textdatei in eine Zeichenfolgenvariable einzulesen, und dann die Funktion preg_match_all verwenden, um alle Satzzeichen abzugleichen und in einem Array zu speichern:

$text = file_get_contents('article.txt');
preg_match_all('/[,.?!;:]/', $text, $matches);
$counts = array_count_values($matches[0]);
print_r($counts);

Im obigen Code haben wir liest einen Text aus einer Textdatei und verwendet den regulären Ausdruck „/[,.?!;:]/“, um alle darin enthaltenen Satzzeichen abzugleichen. Verwenden Sie dann die in PHP integrierte Funktion array_count_values ​​​​, um die Anzahl der Vorkommen verschiedener Satzzeichen zu zählen. Verwenden Sie abschließend die Funktion print_r, um die statistischen Ergebnisse auszugeben.

Wenn die Textdatei Article.txt den folgenden Inhalt enthält:

Wie geht es dir? Mein Name ist Mike!

Dann die Ausgabe des obigen Codes wird sein:

Array
(
    [,] => 2
    [.] => 3
    [?] => 2
)

Das bedeutet, dass im obigen Text 2 Kommas, 3 Punkte und 2 Fragezeichen verwendet werden.

4. Zusammenfassung

In diesem Artikel wird die Methode zur Verwendung regulärer Ausdrücke zum Abgleichen verschiedener Satzzeichen vorgestellt, einschließlich allgemeiner Satzzeichen, Ellipsen, doppelter Anführungszeichen und einfacher Anführungszeichen usw. Durch die Demonstration tatsächlicher Fälle können wir sehen, dass die Verwendung regulärer Ausdrücke verschiedene Textdaten einfach und effizient verarbeiten kann, was der Programmentwicklung viel Komfort bringt. In der tatsächlichen Entwicklung können wir die geeignete Methode basierend auf den tatsächlichen Anforderungen auswählen und die Leistungsfähigkeit regulärer Ausdrücke voll ausschöpfen.

Das obige ist der detaillierte Inhalt vonPHP-Kampf gegen reguläre Ausdrücke: Passende Satzzeichen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn