ホームページ  >  に質問  >  本文

Pythonはデータをクロールしてリストを取得しますが、その中のspanタグを削除するにはどうすればよいですか?

p6ython3.6を使ってデータをクロールダウンしたのですが、最終的に表示されたのはspanタグを含むリストで、get_textやcontentsなどを使用するとエラーが報告されてしまいます。どうしてこれなの?
返される最初の結果は次のとおりです:

リーリー

私のコードは次のとおりです:

リーリー
我想大声告诉你我想大声告诉你2735日前991

全員に返信(3)返信します

  • 仅有的幸福

    仅有的幸福2017-05-18 10:57:53

    bs の API はよく覚えていないのですが、テキストを直接取得できる関数があるはずです。get_text()这个函数吧。由于你用的是find_all() それから、返された結果を再度トラバースする必要があります。 リーリー

    さらに、正規表現を使用して

    このパターンに直接一致させることもできます。ただし、上記のようにコンテンツリストをたどる必要があります。 <span>(.*?)<

    返事
    0
  • phpcn_u1582

    phpcn_u15822017-05-18 10:57:53

    質問者はtext_content()方法を試すことができます

    返事
    0
  • ringa_lee

    ringa_lee2017-05-18 10:57:53

    正規表現やsplit+SUBSTRINGも使用できるので柔軟に使いましょう

    返事
    0
  • キャンセル返事