>  기사  >  백엔드 개발  >  Python에서 영숫자가 아닌 문자를 효율적으로 제거하는 방법은 무엇입니까?

Python에서 영숫자가 아닌 문자를 효율적으로 제거하는 방법은 무엇입니까?

Barbara Streisand
Barbara Streisand원래의
2024-11-06 11:30:03346검색

How to Efficiently Strip Non-Alphanumeric Characters in Python?

Python에서 영숫자가 아닌 문자 제거

Python에서 문자열에서 영숫자가 아닌 문자를 제거하려면 PHP와 약간 다른 접근 방식이 필요합니다. .

파이썬 메서드

진정한 "파이썬" 솔루션을 위해서는 다음 메서드를 고려하세요.

  • 영숫자 문자 결합: List Comprehension을 사용하여 문자열의 문자를 반복하고 영숫자 문자만 결합합니다.
  • 영숫자 필터링: filter() 함수와 str.isalnum()을 사용하여 영숫자가 아닌 문자를 필터링합니다.

대체 접근 방식

성능을 고려하여 다른 방법이 더 빠를 수 있습니다.

  • [W_]로 정규식 대체: 영숫자가 아닌 모든 문자를 일치시키고 대체하도록 정규식([W_])을 컴파일합니다.
  • **pattern.sub()로 정규식 대체: 반복되는 경우 대체하려면 re.compile()을 사용하여 정규식을 미리 컴파일한 다음 Pattern.sub()를 사용하십시오.

성능 벤치마킹

다음은 다양한 타이밍 결과입니다. string.printable 문자열을 사용하는 메서드:

Method Time (μs/loop)
Join alphanumeric 57.6
Filter alphanumeric 37.9
Regex substitution with [W_] 27.5
Regex substitution with [W_] 15
Regex substitution with pattern.sub() 11.2

타이밍을 보면 패턴.sub()와 함께 미리 컴파일된 정규식을 사용하는 것이 가장 빠른 방법입니다.

위 내용은 Python에서 영숫자가 아닌 문자를 효율적으로 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.