ホームページ >バックエンド開発 >Python チュートリアル >Python 文字列の HTML エンティティをデコードするには?

Python 文字列の HTML エンティティをデコードするには?

Barbara Streisand
Barbara Streisandオリジナル
2024-12-14 05:33:09340ブラウズ

How to Decode HTML Entities in Python Strings?

Python 文字列の HTML エンティティをデコードするには?

Beautiful Soup 3 で HTML を解析すると、HTML エンティティが頻繁に表示されるため、デコードする必要があります。これは、html.unescape() または HTMLParser.unescape() 関数を使用して実行できます。

Python 3.4

Use html.unescape():

import html
html.unescape('£682m')

Python 2.6-3.3

Python の HTMLParser から2.6-2.7 または Python 3 の html.parser、unescape():

from html.parser import HTMLParser
parser = HTMLParser()
print(h.unescape('£682m'))

または、6 つの互換性ライブラリを使用:

from six.moves.html_parser import HTMLParser
parser = HTMLParser()
print(h.unescape('£682m'))

以上がPython 文字列の HTML エンティティをデコードするには?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。