HTML ページでは、他の機会に使用するために画像リンクを抽出したり、画像のダウンロードやバッチ処理などを行う必要があることがよくあります。現時点では、PHP 正規表現は、すべての画像リンクを迅速かつ正確に照合するのに役立ちます。
1. HTML 内の画像リンクの分析
HTML では、画像リンクは通常 a1f02c36ba31691bcfe87b2722de723b タグの形式で表示され、その形式は次のとおりです:
<img src="image.jpg" alt="图片">
このうち、src属性は画像のリンクアドレスを指定します。一般に、画像リンクの形式は次のとおりです。
これら 4 つのリンク形式に一致する正規表現を作成する必要があります。
2. PHP 正規表現マッチング画像リンク
PHP にはさまざまな種類の正規表現関数がありますが、その中で最も一般的に使用されるのが preg_match() で、テキストからのマッチングに使用できます。指定された文字列。以下は、上記の 4 つの画像リンク形式に一致する正規表現です:
$pattern = '/<img.+?src=['"](.+?)['"].*?>/';
この正規表現は複数の部分で構成されています。以下で 1 つずつ説明します。 img. ?src= は a1f02c36ba31691bcfe87b2722de723b タグに一致し、src 属性の前に配置されます。このうち . ? は、src が見つかるまでの任意の文字の非貪欲一致を意味します。
$html = file_get_contents('example.html'); // 读取 HTML 文件 preg_match_all($pattern, $html, $matches); // 匹配链接 $imgUrls = $matches[1]; // 获取匹配到的链接地址
$pattern = '/<img.+?src=['"](https?://.+?)['"].*?>/';
概要
PHP 正規表現を使用して HTML 内の画像リンクを照合することは複雑なことではありません。リンク形式に従って対応する正規表現を記述し、preg_match() を使用するだけです。すべてのリンクを迅速かつ正確に抽出する関数。HTML から他のコンテンツを頻繁に抽出する必要がある場合は、同様の方法で実現することもできます。
以上がPHP 正規表現: HTML 内のすべての画像リンクを照合する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。