PythonのANDを含む正規表現

Question

私はしばらくの間、次のタスク用の正しい正規表現を取得しようと苦労してきました。Python を使用して HTML ファイル内のテーブルタグからデータを削除したいと考えています。これを行う私のアプローチは、次のことを再帰的に実行することです (タグ間の HTML 行を文字列として保存します)。 s="desired content" 文字列 s を、"" の間のすべてを削除する文字列に再割り当てします。 s=re.sub('{1}','',s) s="希望のコンテンツ" が残るまでこの操作を繰り返します。私の質問は、括弧内の太字部分をどのように実装するかです。ありがとう。あなたのテキストメッセージを私に送ってください

P粉348088995 · Answer

文字クラスを否定するには、[ の後に ^ を置きます。また、1 回出現する文字については {1} を指定する必要はありません。

リーリー

ただし、HTML からデータを取得するには、正規表現の代わりに BeautifulSoup のような専用の HTML パーサーを使用する方が適切であることに注意してください。

PythonのANDを含む正規表現

全員に返信(1)返信します