Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menyahkod Entiti HTML dalam Rentetan Python?
Apabila menghuraikan HTML dengan Beautiful Soup 3, entiti HTML sering muncul dan perlu dinyahkodkan. Ini boleh dilakukan menggunakan fungsi html.unescape() atau HTMLParser.unescape().
Gunakan html.unescape():
import html html.unescape('£682m')
Dari HTMLParser dalam Python 2.6-2.7 atau html.parser dalam Python 3, unescape():
from html.parser import HTMLParser parser = HTMLParser() print(h.unescape('£682m'))
Sebagai alternatif, dengan enam perpustakaan keserasian:
from six.moves.html_parser import HTMLParser parser = HTMLParser() print(h.unescape('£682m'))
Atas ialah kandungan terperinci Bagaimana untuk Menyahkod Entiti HTML dalam Rentetan Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!