Maison  >  Questions et réponses  >  le corps du texte

python - Comment obtenir le contenu souhaité en incluant la balise <dl></dl>

1. Lorsque j'ajoute la balise <dl>, j'obtiens du contenu vide. Comment dois-je écrire les règles de correspondance pour obtenir le contenu souhaité sans ajouter la balise <dl>

pattern = re.compile(r'<dl>.*?<dd><a href="(.*?)">(.*?)</a></dd>.*?</dl>')

3. Vous pouvez obtenir le contenu souhaité sans ajouter la balise <dl>

4. Ci-joint le code source de la page Web

<dl>
                <dt>《明末工程师》正文</dt>
                <dd><a href="/book/1440/xx">第一章 穿越后的窘境</a></dd>
</dl>
ringa_leeringa_lee2712 Il y a quelques jours536

répondre à tous(2)je répondrai

  • 黄舟

    黄舟2017-05-18 10:51:18

    # 你可能需要加个模式
    # re.S    使 . 匹配包括换行在内的所有字符
    pattern = re.compile(r'<dl>.*?<dd><a href="(.*?)">(.*?)</a></dd>.*?</dl>', re.S)
    print re.findall(pattern, a)

    répondre
    0
  • 迷茫

    迷茫2017-05-18 10:51:18

    // /需要转义下
    <dl>.*?<dd><a href="(.*?)">(.*?)<\/a><\/dd>.*?<\/dl>

    répondre
    0
  • Annulerrépondre