Maison  >  Questions et réponses  >  le corps du texte

python - Pourquoi lxml.etree ajoute-t-il automatiquement un plus</i>?

J'apprends lxml, le code est le suivant :

from lxml import etree
text = '''
<i class="cell maincell">
    <p class="title">
        <a target="_blank" href="https://itjuzi.com/company/60321">
            <span>洋鼹鼠</span>
        </a>
    </p>
    <p>
        <span class="tags t-small c-gray-aset">
            <a href="https://itjuzi.com/investevents?scope=145">电子商务</a>
        </span>
        <span class="loca c-gray-aset t-small">
            <a href="https://itjuzi.com/investevents?prov=天津">天津</a>
        </span>
    </p>
</i>
'''
html = etree.HTML(text)
print(etree.tostring(html,encoding='utf-8').decode('utf-8'))

Le résultat est le suivant :

<html><body><i class="cell maincell">
    </i><p class="title">
        <a target="_blank" href="https://itjuzi.com/company/60321">
            <span>洋鼹鼠</span>
        </a>
    </p>
    <p>
        <span class="tags t-small c-gray-aset">
            <a href="https://itjuzi.com/investevents?scope=145">电子商务</a>
        </span>
        <span class="loca c-gray-aset t-small">
            <a href="https://itjuzi.com/investevents?prov=天津">天津</a>
        </span>
    </p>

</body></html>

Principalement, je ne comprends pas pourquoi il y a une erreur dans l'étiquette <i> ? Comment résoudre ce problème? Merci~

学习ing学习ing2647 Il y a quelques jours730

répondre à tous(1)je répondrai

  • PHP中文网

    PHP中文网2017-06-22 11:54:40

    Principalement parce que

    Élément p
    Classification du contenu Contenu de flux, contenu palpable.
    Contenu autorisé Contenu de phrase.
    Éléments parents autorisés Tout élément qui accepte le contenu de flux

    i Element
    Catégories de contenu Contenu fluide, contenu de formulation, contenu palpable.
    Contenu de formulation d'autorisation.

    Évidemment, l'élément parent de l'élément P doit être de type contenu flow, mais je ne remplis pas les conditions, ce qui signifie qu'il n'est pas conforme à la spécification.
    La solution est de remplacer i directement par p.

    répondre
    0
  • Annulerrépondre