python - Wie kann ich „<abc>“ automatisch maskieren, wenn ich unter Python3 auf solche HTML-Escape-Zeichen stoße?

Question

Ich bin neu in Python. Als ich den Scray-Crawler benutzte, bin ich auf die Sonderzeichen von HTML gestoßen, also habe ich das Dokument auf Baidu durchsucht: import HTMLParser html_parser = HTMLParser.HTMLParser() s = '&l t;abc&g t;&nbs p;' #Webseitenübertragung vermeiden Es ist noch ein Leerzeichen übrig s = ...

某草草 · Answer

from html.parser import HTMLParser
html_parser = HTMLParser()
s = '<abc> '
txt = html_parser.unescape(s)
print(txt)
# 结果：

python - Wie kann ich „&lt;abc&gt;“ automatisch maskieren, wenn ich unter Python3 auf solche HTML-Escape-Zeichen stoße?

Antworte allen(1)Ich werde antworten

python - Wie kann ich „<abc>“ automatisch maskieren, wenn ich unter Python3 auf solche HTML-Escape-Zeichen stoße?