ホームページ  >  に質問  >  本文

python - 怎么查看Beautiful Soup的prettify(encoding, formatter="minimal")

soup=bs(html)
html2 = soup.prettify('utf-8', formatter='minimal')

prettify() 方法的第二个参数 formatter 到底有几个合法的取值呢?

我们只知道有 minimal, 还有什么呢?我们都不知道.
怎么找到这些参数的值呢?
这是 python 最不好的一个地方,方法的说明里不写明白,使用者怎么寻找这些特定的取值呢?

巴扎黑巴扎黑2741日前968

全員に返信(2)返信します

  • 迷茫

    迷茫2017-04-18 10:29:16

    在官方の文書裡面就有完整的說明了:

    出力フォーマッタ

    • デフォルトは formatter="minimal" です。文字列は、Beautiful Soup が有効な HTML/XML を生成できるようにするためにのみ処理されます

    • formatter="html" を渡すと、Beautiful Soup は可能な限り Unicode 文字を HTML エンティティに変換します

    • formatter=None を渡すと、Beautiful Soup は出力時に文字列をまったく変更しません。これは最も速いオプションですが、Beautiful Soup が無効な HTML/XML を生成する可能性があります

    • 最後に、フォーマッタの関数を渡すと、Beautiful Soup はドキュメント内のすべての文字列と属性値に対してその関数を 1 回呼び出します。この機能では何でもできます。

    至於要找 コード:

    リーリー

    我回答過多の問題: Python-QA

    返事
    0
  • 伊谢尔伦

    伊谢尔伦2017-04-18 10:29:16

    コードを見てください...

    リーリー

    https://imgur.com/gallery/VkNUvを参照してください

    この写真が表示できない理由がわかりません

    返事
    0
  • キャンセル返事