PHP プログラミングでは、正規表現は、文字列に対して高速かつ効果的な一致および置換操作を実行できる、非常に一般的に使用されるツールです。句読点は、テキストに多くの豊富なセマンティクスをもたらすことができる一般的な文字列要素です。この記事では、正規表現を使用して句読点を照合し、よりインテリジェントなテキスト処理を行う方法を紹介します。
1. 句読点の種類
正規表現において、句読点は特定の概念や種類ではありません。代わりに、カンマ、ピリオド、感嘆符、疑問符、セミコロンなどのさまざまな一般的な特殊文字を指します。これらの句読点は、言語学、文学、出版などのさまざまな分野で広く使用されています。
2. 句読点を照合する方法
正規表現では、特殊文字またはメタキャラクターを使用してさまざまな句読点を照合できます。一般的な句読点の照合方法の一部を次に示します。
一般的な句読点とは、コンマ、ピリオド、感嘆符、疑問符、セミコロン、一般的な句読点を指します。コロンなどの記号は、角かっこ []:
preg_match_all('/[,.?!;:]/', $text, $matches); // 匹配逗号、句号、感叹号、问号、分号、冒号
を使用して照合できます。上記のコードでは、preg_match_all 関数と正規表現 '/[,.?!;:]/' を使用して、すべてのカンマと照合します。ピリオド、感嘆符、疑問符、セミコロン、コロン。角括弧 [] は、複数の文字を含む文字セットを表します。正規表現では、ピリオドは任意の文字のワイルドカード文字を表すため、 としてエスケープする必要があります。
省略記号は、連続する 3 つのピリオドで構成される記号です。正規表現 '...' を使用して、それらを一致させることができます:
preg_match_all('/…/', $text, $matches); // 匹配省略号
上記のコードでは、preg_match_all 関数と正規表現 '/.../' を使用して、すべての省略記号と一致します。省略記号内のピリオドは としてエスケープする必要があります。
PHP プログラムでは、文字列の定義に二重引用符と一重引用符がよく使用されます。また、これら 2 つの引用符も同じ一般的な句読点です。マーク。角括弧 [] を使用して一致させることができます:
preg_match_all('/["']/', $text, $matches); // 匹配双引号和单引号
上記のコードでは、preg_match_all 関数と正規表現 '/["']/' を使用して二重引用符と一重引用符を一致させます。式自体も一重引用符または二重引用符を使用して定義されるため、' または " としてエスケープする必要があります。
3. ケース分析
句読点を一致させる方法をよりよく理解するために、テキスト内でさまざまな句読点が使用される回数を数える実際のケースを以下に示します。
まず、PHP の組み込み file_get_contents 関数を使用してテキスト ファイルを文字列変数に読み取り、次に preg_match_all 関数を使用してすべての句読点を照合し、配列に保存します。 ##上記のコードでは、テキスト ファイルからテキストの一部を読み取り、正規表現 '/[,.?!;:]/' を使用してその中のすべての句読点と一致させます。次に、PHP 組み込み関数 array_count_values を使用して、さまざまな句読点の出現数をカウントします。最後に、print_r 関数を使用して統計結果を出力します。
テキスト ファイルarticle.txt に次の内容が含まれている場合:
お元気ですか? 元気です、ありがとうございます。どうですか? 私の名前はマイクです。よろしくお願いします!
上記のコードの出力結果は次のようになります:
$text = file_get_contents('article.txt'); preg_match_all('/[,.?!;:]/', $text, $matches); $counts = array_count_values($matches[0]); print_r($counts);
これは、上記のテキストで 2 つのカンマ、3 つのピリオド、および 2 つの疑問符が使用されていることを意味します。
4. 概要
この記事では、正規表現を使用して、一般的な句読点、省略記号、二重引用符、一重引用符などのさまざまな句読点を照合する方法を紹介します。実際の事例を通じて、正規表現を使用することでさまざまなテキストデータを簡単かつ効率的に処理でき、プログラム開発に大きな利便性をもたらすことがわかります。実際の開発では、実際のニーズに基づいて適切な方法を選択し、正規表現の力を最大限に活用することができます。
以上がPHP 正規表現戦闘: 句読点の一致の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。