Python에서 정규 표현식으로 문자열 대체
질문:
HTML을 어떻게 바꿀 수 있나요? 정규식을 사용하여 문자열 내의 태그 Python?
입력:
this is a paragraph with<[1]> in between</[1]> and then there are cases ... where the<[99]> number ranges from 1-100</[99]>. and there are many other lines in the txt files with<[3]> such tags </[3]>
원하는 출력:
this is a paragraph with in between and then there are cases ... where the number ranges from 1-100. and there are many other lines in the txt files with such tags
해결책:
정규 표현식을 사용하여 여러 태그를 바꾸려면 Python에서는 다음 단계를 따르세요.
import re line = re.sub(r"<\/?\[\d+>]", "", line)
설명:
정규식 r"?[d >"]는 시작하는 모든 태그와 일치합니다. <로 시작하고 그 뒤에 임의의 숫자가 오고 >로 끝납니다. 물음표 문자 ? / 뒤는 슬래시가 선택 사항임을 나타냅니다. sub 함수는 각 일치 항목을 빈 문자열로 대체합니다.
설명 버전:
line = re.sub(r""" (?x) # Use free-spacing mode. < # Match a literal '<' /? # Optionally match a '/' \[ # Match a literal '[' \d+ # Match one or more digits > # Match a literal '>' """, "", line)
추가 참고 사항:
위 내용은 Python 정규식을 사용하여 문자열에서 HTML 태그를 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!