>  기사  >  백엔드 개발  >  Python의 문자열에서 영숫자가 아닌 문자를 효율적으로 제거하려면 어떻게 해야 합니까?

Python의 문자열에서 영숫자가 아닌 문자를 효율적으로 제거하려면 어떻게 해야 합니까?

Barbara Streisand
Barbara Streisand원래의
2024-11-05 22:20:02789검색

How Can I Efficiently Remove Non-Alphanumeric Characters from Strings in Python?

Python의 문자열에서 영숫자가 아닌 문자 제거

문자열에서 영숫자가 아닌 문자를 제거하려면 문자, 숫자 및 숫자 이외의 문자를 제거해야 합니다. 밑줄. PHP를 위한 솔루션이 존재하지만 Python 원칙에 부합하지 않을 수 있습니다.

한 가지 효율적인 방법은 영숫자가 아닌 문자(W_)와 일치하는 정규식을 정의하고 이를 빈 문자열로 대체하는 것입니다. 컴파일된 정규식 패턴과 함께 re.sub() 함수 사용:

<code class="python">import re, string
pattern = re.compile('[\W_]+')  # Compiled regular expression
string.printable = string.printable.replace(pattern, '')  # Substitute non-alphanumeric characters with empty string</code>

다른 방법에는 목록 이해를 사용하여 영숫자가 아닌 문자를 필터링하거나 filter( ):

<code class="python">''.join(ch for ch in string if ch.isalnum())
filter(str.isalnum, string)</code>

비교 벤치마킹에서는 컴파일된 정규 표현식을 사용하는 re.sub() 접근 방식이 최고의 성능을 발휘하는 것으로 나타났습니다.

$ python -m timeit -s \
    "import re, string; pattern = re.compile('[\W_]+')" \
    "pattern.sub('', string.printable)"
100000 loops, best of 3: 11.2 usec per loop

위 내용은 Python의 문자열에서 영숫자가 아닌 문자를 효율적으로 제거하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.