Maison >développement back-end >Tutoriel Python >Comment obtenir la valeur d'un élément dans un robot en python
Il existe de nombreuses façons d'obtenir la valeur d'un élément dans crawler Voici quelques méthodes courantes :
.import re html = "<a href='https://www.example.com'>Example</a>" links = re.findall(r"<a.*?href=['\"](.*?)['\"].*?>(.*?)</a>", html) for link in links: url = link[0] text = link[1] print("URL:", url) print("Text:", text)
from bs4 import BeautifulSoup html = "<h1>This is a title</h1>" soup = BeautifulSoup(html, 'html.parser') titles = soup.find_all('h1') for title in titles: print("Title:", title.text)
from lxml import etree html = "<p>This is a paragraph.</p>" tree = etree.HTML(html) paragraphs = tree.xpath('//p') for paragraph in paragraphs: print("Text:", paragraph.text)
Ce sont des méthodes courantes. La méthode à utiliser dépend des caractéristiques du site Web que vous explorez et de la structure des données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!