Heim > Fragen und Antworten > Hauptteil
Ich verwende Python, um den CSDN-Webcrawler auszuführen. Beim Crawlen des Webseitentitels kann der reguläre Ausdruck, den ich verwendet habe, nicht mehr in CSDN verwendet werden. Der Titel wird in einer neuen Zeile angezeigt (?<=<title>).+?(?=<)
PS:
Nach der Methode von @caimaoy habe ich den regulären Ausdruck in
geändert und der Titel wurde perfekt extrahiert. (?<=<title>)(?:.|n)+?(?=<)
Nochmals vielen Dank an alle.
曾经蜡笔没有小新2017-06-22 11:53:43
表达式那边加个flag
吧
tite = '......'
print(re.findall('(?<=\<title\>).+?(?=\<)', title, re.S))