Python의 문자열에서 영숫자가 아닌 문자 제거
문자열에서 영숫자가 아닌 문자를 제거하려면 문자, 숫자 및 숫자 이외의 문자를 제거해야 합니다. 밑줄. PHP를 위한 솔루션이 존재하지만 Python 원칙에 부합하지 않을 수 있습니다.
한 가지 효율적인 방법은 영숫자가 아닌 문자(W_)와 일치하는 정규식을 정의하고 이를 빈 문자열로 대체하는 것입니다. 컴파일된 정규식 패턴과 함께 re.sub() 함수 사용:
<code class="python">import re, string pattern = re.compile('[\W_]+') # Compiled regular expression string.printable = string.printable.replace(pattern, '') # Substitute non-alphanumeric characters with empty string</code>
다른 방법에는 목록 이해를 사용하여 영숫자가 아닌 문자를 필터링하거나 filter( ):
<code class="python">''.join(ch for ch in string if ch.isalnum()) filter(str.isalnum, string)</code>
비교 벤치마킹에서는 컴파일된 정규 표현식을 사용하는 re.sub() 접근 방식이 최고의 성능을 발휘하는 것으로 나타났습니다.
$ python -m timeit -s \ "import re, string; pattern = re.compile('[\W_]+')" \ "pattern.sub('', string.printable)" 100000 loops, best of 3: 11.2 usec per loop
위 내용은 Python의 문자열에서 영숫자가 아닌 문자를 효율적으로 제거하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!