ホームページ  >  記事  >  バックエンド開発  >  PHP 正規表現: HTML 内のすべての段落を一致させる方法

PHP 正規表現: HTML 内のすべての段落を一致させる方法

PHPz
PHPzオリジナル
2023-06-22 09:09:221143ブラウズ

Web サイトやクローラーを開発する場合、多くの場合、必要なコンテンツを HTML から抽出する必要があり、その際には照合に正規表現を使用する必要があります。この記事では、PHP 正規表現を使用して HTML のすべての段落を照合する方法を紹介します。

まず、HTML の段落は e388a4556c0f65e1904146cc1a846bee タグによって定義されていることを理解する必要があります。したがって、HTML 内のすべての段落を取得するには、正規表現を使用して e388a4556c0f65e1904146cc1a846bee タグを含むすべての行と一致する必要があります。

これは、文字列内の最初の段落を検索するための簡単な PHP コード ブロックです。

$str = '<p>这是第一个段落。</p><p>这是第二个段落。</p>';
preg_match('/<p>(.*?)</p>/s', $str, $matches);
echo $matches[1];

出力: これは最初の段落です。

ここで使用される正規表現は /e388a4556c0f65e1904146cc1a846bee(.*?)94b3e26ee717c64999d7867364b1b4a3/s です。このうち、/s. という意味で、復帰と改行が一致することを意味するため、復帰と改行を含む段落も一致することができます。

ただし、上記のコードでは最初の段落のみに一致するため、すべての段落に一致させたい場合は preg_match_all 関数を使用する必要があります。

$str = '<p>这是第一个段落。</p><p>这是第二个段落。</p>';
preg_match_all('/<p>(.*?)</p>/s', $str, $matches);
foreach ($matches[1] as $match) {
    echo $match . '<br>';
}

出力:

これは最初の段落です。
これは 2 番目の段落です。

ここでは preg_match_all 関数が使用されており、foreach ループを使用して $matches[1] 配列を走査して、一致するすべての段落を取得します。

これまでのところ、PHP 正規表現を使用して HTML のすべての段落のコンテンツを照合することに成功しました。ただし、実際の開発プロセスでは、HTML にはネストされたタグや段落内の特殊文字など、正規表現の一致結果に影響を与える可能性のある特殊な状況が含まれる可能性があることに注意することが重要です。したがって、HTML コードのさまざまな状況に適応するために、必要に応じて正規表現を調整する必要があります。

概要

PHP 正規表現を使用して HTML 内のすべての段落と一致するプロセスは次のとおりです。

  1. 正規表現の使用/e388a4556c0f65e1904146cc1a846bee (. *?)94b3e26ee717c64999d7867364b1b4a3/s e388a4556c0f65e1904146cc1a846bee タグを含む段落に一致します。
  2. preg_match_all 関数を使用して、一致するすべての段落を取得します。
  3. 実際のニーズに応じて、さまざまな HTML コードを調整します。

PHP 正規表現を HTML の段落に一致させる方法をマスターすると、HTML のテキスト コンテンツの処理が容易になり、開発効率が向上します。

以上がPHP 正規表現: HTML 内のすべての段落を一致させる方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。