検索

ホームページ  >  に質問  >  本文

PythonのANDを含む正規表現

私は、次のタスクのための正しい正規表現を取得するのにしばらく苦労してきました:

Pythonを使用してHTMLファイル内のテーブルタグからデータを削除したいと考えています。これに対する私のアプローチは、次のことを再帰的に実行することです (タグ間の HTML 行を文字列として保存します)。

s = "

必須コンテンツ"

    文字列 s を、「
  1. 」の間のすべてを削除した文字列に再代入します。 <...>
s = re.sub('

は '<{1}('<' 也不是 '> ではありません).*>{1}', '', s)

    s = "欲しいもの" が残るまでこれを繰り返します。
私の質問は、括弧内の太字部分をどのように実装するかです。ありがとう。 ###あなたのテキスト###### ###私は試した### リーリー

テスト文字列が同じままであることがわかります。私が何を間違えたのでしょうか? 私が期待している上記のコードは私に与えます test_str = "Hello

" の場合、これをこのメソッドにフィードバックし、"

" を抽出して "Hello" を返します。

P粉988025835P粉988025835440日前640

全員に返信(1)返信します

  • P粉348088995

    P粉3480889952023-09-15 09:00:18

    文字クラスを否定するには、[ の後に ^ を置きます。また、1 回出現する文字については {1} を指定する必要はありません。

    リーリー

    ただし、HTML からデータを取得するには、正規表現の代わりに BeautifulSoup のような専用の HTML パーサーを使用する方が適切であることに注意してください。

    返事
    0
  • キャンセル返事