Pythonはデータをクロールしてリストを取得しますが、その中のspanタグを削除するにはどうすればよいですか?

Question

p6ython3.6を使ってデータをクロールしてみたのですが、最終的に表示されたのはspanタグを含むリストで、get_textやcontentsなどを使うとエラーになってしまいます。どうしてこれなの？返される最初の結果は次のとおりです: {code...} 私のコードは次のとおりです: {code...}

仅有的幸福 · Answer

bs の API はよく覚えていないのですが、テキストを直接取得できる関数があるはずです。get_text()这个函数吧。由于你用的是find_all() それから、返された結果を再度トラバースする必要があります。リーリー

さらに、正規表現を使用して

このパターンに直接一致させることもできます。ただし、上記のようにコンテンツリストをたどる必要があります。 (.*?)<

phpcn_u1582 · Answer

質問者はtext_content()方法を試すことができます

ringa_lee · Answer

正規表現やsplit+SUBSTRINGも使用できるので柔軟に使いましょう

Pythonはデータをクロールしてリストを取得しますが、その中のspanタグを削除するにはどうすればよいですか?

全員に返信(3)返信します