Maison > Questions et réponses > le corps du texte
J'apprends lxml, le code est le suivant :
from lxml import etree
text = '''
<i class="cell maincell">
<p class="title">
<a target="_blank" href="https://itjuzi.com/company/60321">
<span>洋鼹鼠</span>
</a>
</p>
<p>
<span class="tags t-small c-gray-aset">
<a href="https://itjuzi.com/investevents?scope=145">电子商务</a>
</span>
<span class="loca c-gray-aset t-small">
<a href="https://itjuzi.com/investevents?prov=天津">天津</a>
</span>
</p>
</i>
'''
html = etree.HTML(text)
print(etree.tostring(html,encoding='utf-8').decode('utf-8'))
Le résultat est le suivant :
<html><body><i class="cell maincell">
</i><p class="title">
<a target="_blank" href="https://itjuzi.com/company/60321">
<span>洋鼹鼠</span>
</a>
</p>
<p>
<span class="tags t-small c-gray-aset">
<a href="https://itjuzi.com/investevents?scope=145">电子商务</a>
</span>
<span class="loca c-gray-aset t-small">
<a href="https://itjuzi.com/investevents?prov=天津">天津</a>
</span>
</p>
</body></html>
Principalement, je ne comprends pas pourquoi il y a une erreur dans l'étiquette <i>
? Comment résoudre ce problème? Merci~
PHP中文网2017-06-22 11:54:40
Principalement parce que
Élément p
Classification du contenu Contenu de flux, contenu palpable.
Contenu autorisé Contenu de phrase.
Éléments parents autorisés Tout élément qui accepte le contenu de flux
i Element
Catégories de contenu Contenu fluide, contenu de formulation, contenu palpable.
Contenu de formulation d'autorisation.
Évidemment, l'élément parent de l'élément P doit être de type contenu flow, mais je ne remplis pas les conditions, ce qui signifie qu'il n'est pas conforme à la spécification.
La solution est de remplacer i directement par p.