問題:將文字URL 轉換為超連結可能是一項有用的任務,但當HTML 標籤中的圖像或其他元素也包含URL 時,這就變得具有挑戰性。在特定實例中,使用者尋求一種用錨標記替換文字 URL,同時避免替換圖像來源屬性中嵌入的 URL 的方法。
解決方案:
關鍵解決此問題的方法是使用 XPath 表達式僅選擇那些包含 URL 但不是錨元素後代的文字節點。
這是 XPath 表達式的改進版本:
$xPath = new DOMXPath($dom); $texts = $xPath->query( '/html/body//text()[ not(ancestor::a) and ( contains(.,"http://") or contains(.,"https://") or contains(.,"ftp://") )]' );
此表達式有效地排除錨標記中包含的文字節點,確保僅以純文字 URL 為目標進行轉換。
替換文字 URL 而不影響圖像 URL:
為了避免替換嵌入在圖像來源屬性中的 URL,採用了非標準但有效的方法。不是將文字節點分開,而是使用文件片段將整個文字節點替換為修改後的版本。
以下是執行此任務的程式碼:
foreach ($texts as $text) { $fragment = $dom->createDocumentFragment(); $fragment->appendXML( preg_replace( "~((?:http|https|ftp)://(?:\S*?\.\S*?))(?=\s|\;|\)|\]|\[|\{|\}|,|\"|'|:|\<|$|\.\s)~i", '<a href=""></a>', $text->data ) ); $text->parentNode->replaceChild($fragment, $text); }
在此程式碼中, preg_replace 函數用於搜尋文字節點中的 URL,並將其替換為對應的錨標記版本。
範例:
考慮以下HTML:
<code class="html"><html> <body> <p> This is a text with a <a href="http://example.com/1">link</a> and another <a href="http://example.com/2">http://example.com/2</a> and also another http://example.com with the latter being the only one that should be replaced. There is also images in this text, like <img src="http://example.com/foo"/> but these should not be replaced either. In fact, only URLs in text that is no a descendant of an anchor element should be converted to a link. </p> </body> </html></code>
應用上述解決方案會將文字URL 轉換為錨標記,同時保持圖片URL錨標記不變,產生以下輸出:
<code class="html"><html><body> <p> This is a text with a <a href="http://example.com/1">link</a> and another <a href="http://example.com/2">http://example.com/2</a> and also another <a href="http://example.com">http://example.com</a> with the latter being the only one that should be replaced. There is also images in this text, like <img src="http://example.com/foo"/> but these should not be replaced either. In fact, only URLs in text that is no a descendant of an anchor element should be converted to a link. </p> </body></html></code>
以上是如何用超連結取代文字 URL,同時排除 HTML 標籤中的 URL?的詳細內容。更多資訊請關注PHP中文網其他相關文章!