찾다

 >  Q&A  >  본문

Python에서 AND를 포함하는 정규식

저는 다음 작업에 대한 올바른 정규식을 얻으려고 한동안 어려움을 겪었습니다.

파이썬을 사용하여 html 파일의 테이블 태그에서 데이터를 제거하고 싶습니다. 이에 대한 나의 접근 방식은 다음을 재귀적으로 수행하는 것입니다(태그 사이의 HTML 줄을 문자열로 저장).

s = "필수 콘텐츠"

  1. 문자열 s를 "<...>" 사이의 모든 내용을 제거하는 문자열에 다시 할당합니다.

s = re.sub('<{1}(은 '<' 也不是 '>'이 아닙니다).*>{1}', '', s)

  1. s="원하는 콘텐츠"가 남을 때까지 이 과정을 반복하세요.

제 질문은 괄호 안의 굵은 부분을 어떻게 구현하는지 입니다. 감사해요. 문자

해봤는데

으아아아

내 테스트 문자열이 동일하게 유지되는 것을 볼 수 있습니다. 내가 뭘 잘못했나요?

내가 기대하는 위의 코드는 나에게 다음을 제공합니다. test_str = "Hello", 이 메서드에 다시 입력하고 ""을 추출하여 "Hello"를 제공합니다.

P粉988025835P粉988025835443일 전646

모든 응답(1)나는 대답할 것이다

  • P粉348088995

    P粉3480889952023-09-15 09:00:18

    문자 클래스를 무효화하려면 ^ 放在 [ 之后。此外,您不需要为出现一次的字符指定 {1}를 바꾸세요.

    으아악

    그러나 HTML에서 데이터를 가져오려면 정규식 대신 BeautifulSoup과 같은 전용 HTML 파서를 사용하는 것이 더 적절하다는 점을 참고하세요.

    회신하다
    0
  • 취소회신하다