python - 这个字段的src属性如何用xpath选择？

Question

{代码...} 这个字段的src属性如何用xpath选择？ 我的写法是： {代码...} 中间的xpath是从chrome直接copy的但是无法显示出src属性，最后弹出的是[]不知道哪里有问题、另外如果知道css选择器怎么写的，也可以告知一...

迷茫 · Answer

Que voulez-vous faire, filtrer le code HTML capturé ? Vous pouvez envisager une recherche régulière

大家讲道理 · Answer

Chrome dispose d'un outil appelé xpath-helper, qui peut être téléchargé depuis l'App Store. Vous pouvez utiliser cet outil pour vérifier si votre syntaxe XPath est correcte.
De plus, si la syntaxe est correcte mais ne peut pas être extraite dans le programme, alors il faut considérer que la page web d'origine est une page dynamique et doit être analysée par jsjs.

PHPz · Answer

Le navigateur dispose d'un mécanisme de tolérance aux pannes et corrigera les balises HTML non standard, de sorte que la structure de page que vous voyez dans la console peut être différente de la structure de page que vous demandez à l'aide du code.
Solution :
Perdez la portée du sélecteur
Utilisez la classe pour localiser
Les points d'arrêt dans le code et exécutez en une seule étape pour localiser la règle XPath de cette balise

黄舟 · Answer

J'utilise habituellement bs4, qui est une solution stupide. Vous pouvez également utiliser des règles régulières, mais c'est casse-tête

.

img_tag = soup.find('img', attrs=dict(class="js-refreshCaptcha captcha") )
img_tag_src = img_tag['src']

大家讲道理 · Answer

captchaUrl = ''.join(response.xpath("//img[@class='js-refreshCaptcha captcha']/@src").extract())

python - 这个字段的src属性如何用xpath选择？

répondre à tous(5)je répondrai