首頁 >後端開發 >php教程 >如何用超連結取代文字 URL,同時排除 HTML 標籤中的 URL?

如何用超連結取代文字 URL,同時排除 HTML 標籤中的 URL?

Mary-Kate Olsen
Mary-Kate Olsen原創
2024-10-28 06:28:021070瀏覽

How to Replace Text URLs with Hyperlinks While Excluding URLs within HTML Tags?

克服替換文字URL 並排除HTML 標籤中的URL 的挑戰

問題:將文字URL 轉換為超連結可能是一項有用的任務,但當HTML 標籤中的圖像或其他元素也包含URL 時,這就變得具有挑戰性。在特定實例中,使用者尋求一種用錨標記替換文字 URL,同時避免替換圖像來源屬性中嵌入的 URL 的方法。

解決方案:

關鍵解決此問題的方法是使用 XPath 表達式僅選擇那些包含 URL 但不是錨元素後代的文字節點。

這是 XPath 表達式的改進版本:

$xPath = new DOMXPath($dom);
$texts = $xPath->query(
    '/html/body//text()[
        not(ancestor::a) and (
        contains(.,"http://") or
        contains(.,"https://") or
        contains(.,"ftp://") )]'
);

此表達式有效地排除錨標記中包含的文字節點,確保僅以純文字 URL 為目標進行轉換。

替換文字 URL 而不影響圖像 URL:

為了避免替換嵌入在圖像來源屬性中的 URL,採用了非標準但有效的方法。不是將文字節點分開,而是使用文件片段將整個文字節點替換為修改後的版本。

以下是執行此任務的程式碼:

foreach ($texts as $text) {
    $fragment = $dom->createDocumentFragment();
    $fragment->appendXML(
        preg_replace(
            &quot;~((?:http|https|ftp)://(?:\S*?\.\S*?))(?=\s|\;|\)|\]|\[|\{|\}|,|\&quot;|'|:|\<|$|\.\s)~i&quot;,
            '<a href=&quot;&quot;></a>',
            $text->data
        )
    );
    $text->parentNode->replaceChild($fragment, $text);
}

在此程式碼中, preg_replace 函數用於搜尋文字節點中的 URL,並將其替換為對應的錨標記版本。

範例:

考慮以下HTML:

<code class="html"><html>
<body>
<p>
    This is a text with a <a href=&quot;http://example.com/1&quot;>link</a>
    and another <a href=&quot;http://example.com/2&quot;>http://example.com/2</a>
    and also another http://example.com with the latter being the
    only one that should be replaced. There is also images in this
    text, like <img src=&quot;http://example.com/foo&quot;/> but these should
    not be replaced either. In fact, only URLs in text that is no
    a descendant of an anchor element should be converted to a link.
</p>
</body>
</html></code>

應用上述解決方案會將文字URL 轉換為錨標記,同時保持圖片URL錨標記不變,產生以下輸出:

<code class="html"><html><body>
<p>
    This is a text with a <a href=&quot;http://example.com/1&quot;>link</a>
    and another <a href=&quot;http://example.com/2&quot;>http://example.com/2</a>
    and also another <a href=&quot;http://example.com&quot;>http://example.com</a> with the latter being the
    only one that should be replaced. There is also images in this
    text, like <img src=&quot;http://example.com/foo&quot;/> but these should
    not be replaced either. In fact, only URLs in text that is no
    a descendant of an anchor element should be converted to a link.
</p>
</body></html></code>

以上是如何用超連結取代文字 URL,同時排除 HTML 標籤中的 URL?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn