Maison > Questions et réponses > le corps du texte
1. Lorsque j'ajoute la balise <dl>, j'obtiens du contenu vide. Comment dois-je écrire les règles de correspondance pour obtenir le contenu souhaité sans ajouter la balise <dl>
pattern = re.compile(r'<dl>.*?<dd><a href="(.*?)">(.*?)</a></dd>.*?</dl>')
<dl>
<dt>《明末工程师》正文</dt>
<dd><a href="/book/1440/xx">第一章 穿越后的窘境</a></dd>
</dl>
黄舟2017-05-18 10:51:18
# 你可能需要加个模式
# re.S 使 . 匹配包括换行在内的所有字符
pattern = re.compile(r'<dl>.*?<dd><a href="(.*?)">(.*?)</a></dd>.*?</dl>', re.S)
print re.findall(pattern, a)