为了在页面上查找链接,常见的方法是使用正则表达式。然而,在这样的情况下:
<a title="this" href="that">what?</a>
href 属性没有放在 a 标签的最前面,以下正则表达式可能会失败:
/<a\s[^>]*href=(\"\'??)([^\"\' >]*?)[^>]*>(.*)<\/a>/
为处理 HTML 可能具有挑战性。作为替代方案,请考虑使用 DOM(文档对象模型)来实现此目的。
以下是如何使用 DOM 从 A 检索 href 属性和其他信息elements:
$dom = new DOMDocument; $dom->loadHTML($html); // Loop through all 'a' elements foreach ($dom->getElementsByTagName('a') as $node) { // Output the entire 'a' element's outer HTML echo $dom->saveHtml($node), PHP_EOL; // Get the node's text value echo $node->nodeValue; // Check if the node has a 'href' attribute echo $node->hasAttribute( 'href' ); // Get the 'href' attribute's value echo $node->getAttribute( 'href' ); // Change the 'href' attribute's value $node->setAttribute('href', 'something else'); // Remove the 'href' attribute $node->removeAttribute('href'); }
XPath还可以用来查询特定的属性,比如href属性:
$dom = new DOMDocument; $dom->loadHTML($html); $xpath = new DOMXPath($dom); $nodes = $xpath->query('//a/@href'); foreach($nodes as $href) { echo $href->nodeValue; // echo current attribute value $href->nodeValue = 'new value'; // set new attribute value $href->parentNode->removeAttribute('href'); // remove attribute }
使用DOM,可以轻松检索和操作诸如来自 A 元素的 href 之类的属性。这种方法提供了比正则表达式更可靠、更灵活的 HTML 处理方式。
以上是如何从 HTML 中的 `` 元素可靠地检索 `href` 属性?的详细内容。更多信息请关注PHP中文网其他相关文章!