ホームページ  >  記事  >  バックエンド開発  >  PHP 正規表現の動作: Web サイトのタイトルの一致

PHP 正規表現の動作: Web サイトのタイトルの一致

WBOY
WBOYオリジナル
2023-06-23 10:30:141353ブラウズ

PHP 正規表現の練習: Web サイトのタイトルの照合

Web 開発では、Web ページのタイトルや記事の要約など、Web ページから特定の情報を抽出する必要があることがよくあります。 PHP 正規表現は、これらの関数を迅速かつ便利に実装するのに役立ちます。この記事では、PHP 正規表現を使用して Web サイトのタイトルを照合する方法を紹介します。

1. Web サイトのタイトルの構造を理解する

PHP 正規表現を使用して Web サイトのタイトルと一致させる前に、Web サイトのタイトルの構造を理解する必要があります。通常、Web サイトのタイトルには次の部分が含まれます:

1. Web サイト名: 通常、タイトルの先頭に表示され、Web サイトの名前を示します。

2. Web ページのタイトル: Web サイト名の後にあり、現在開いている Web ページのタイトルを示します。

3. 区切り文字: Web サイト名と Web ページ タイトルの間にあり、縦棒、ピリオド、その他の文字を使用して Web サイト名と Web ページ タイトルを区別できます。

たとえば、一般的な Web サイトのタイトルの構造は次のとおりです:

「XXXX.net | 最新ニュース、話題の情報、エンターテイメント ゴシップ」

この例では、 Web サイトの名前は「XX Network」、区切り文字は縦棒「|」、Web ページのタイトルは「最新ニュース、ホットな情報、エンターテイメント ゴシップ」です。

2. PHP 正規表現を使用して Web サイトのタイトルと一致させる

Web サイトのタイトルの構造を理解した後、PHP 正規表現を使用して Web サイトのタイトルと一致させることができます。

まず、一致させる Web サイトのタイトルを変数に保存する必要があります。例:

$title = "XXXX.net | 最新ニュース、注目の情報、エンターテイメント ゴシップ" ;

次に、preg_match 関数を使用して Web サイトのタイトルを照合します。 preg_match 関数の最初のパラメータは正規表現、2 番目のパラメータは一致する文字列、3 番目のパラメータは一致結果を格納するために使用される配列です。

次は、Web サイトのタイトルに一致する PHP コードです:

$title = "某某网 | 最新新闻、热点资讯、娱乐八卦";

$pattern = '/^(.*?)s*|s*(.*?)$/';

if (preg_match($pattern, $title, $matches)) {

    $site_name = $matches[1];

    $page_title = $matches[2];

    echo "网站名称:".$site_name."
";

    echo "网页标题:".$page_title."
";

}

このコードでは、正規表現「/^(.?)s|s」を使用します。 (.?)$/」を Web サイトのタイトルと一致させます。この正規表現の意味は次のとおりです:

1.^(.?): Web サイト名と一致することを意味し、.? を使用すると可能な限り少ない文字と一致することを意味し、? は一致しないことを意味します。 -貪欲なマッチング。

2.s|s: 区切り文字の一致を意味し、s* は任意の数の空白文字の一致を意味し、| は垂直バーの一致を意味します。

3.(.?): Web ページのタイトルと一致することを示します。.? を使用すると、可能な限り少ない文字と一致することを意味します。

4.$: 一致する文字列の終わりを示します。

正規表現が $title 文字列と正常に一致した場合、$matches 配列には一致した結果が含まれます。 $matches[1] は Web サイト名を表し、$matches[2] は Web ページのタイトルを表します。

最後に、一致結果を出力します:

Web サイト名: XX.net

Web ページのタイトル: 最新ニュース、注目の情報、エンターテイメント ゴシップ

三, まとめ

この記事では、PHP 正規表現を使用して Web サイトのタイトルを照合する方法を紹介します。実際の開発では、さまざまなタイプの Web サイトのタイトルに適応するために、独自のニーズに応じて正規表現パターンを調整できます。同時に、PHP の他の機能を使用して、記事の概要や著者名などの他の情報を Web ページから抽出することもできます。

以上がPHP 正規表現の動作: Web サイトのタイトルの一致の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。