>백엔드 개발 >파이썬 튜토리얼 >마침표와 공백을 유지하면서 ASCII가 아닌 문자를 제거하는 방법은 무엇입니까?

마침표와 공백을 유지하면서 ASCII가 아닌 문자를 제거하는 방법은 무엇입니까?

DDD
DDD원래의
2024-10-19 20:37:29989검색

How to Remove Non-ASCII Characters while Preserving Periods and Spaces?

마침표와 공백을 유지하면서 ASCII가 아닌 문자 제거

목표는 .txt 파일에 저장된 텍스트 데이터를 처리하고 ASCII가 아닌 문자 없이 문자열을 사용하며 공백과 마침표를 모두 유지합니다. 이를 달성하기 위해 제공된 코드는 ASCII 값을 확인하여 문자가 포함되어야 하는지 결정하는 onlyascii() 함수를 정의합니다. 그러나 현재는 마침표와 공백도 제거합니다.

마침표와 공백을 제외하도록 ascii()만 수정하려면 Python의 string.printable 모듈을 활용할 수 있습니다. string.printable에는 공백과 마침표를 포함하여 인쇄 가능한 것으로 간주되는 문자 집합이 포함되어 있습니다.

string.printable을 활용하는 onlyascii()의 업데이트된 정의는 다음과 같습니다.

def onlyascii(char):
    if ord(char) < 48 or ord(char) > 127 or char not in string.printable:
        return ''
    else:
        return char

이 검사를 공백과 마침표를 제외하고 인쇄할 수 없는 문자인 onlyascii()는 필터링됩니다.

업데이트된 onlyascii() 함수를 사용하여 수정된 코드는 다음과 같습니다.

def onlyascii(char):
    if ord(char) < 48 or ord(char) > 127 or char not in string.printable:
        return ''
    else:
        return char

def get_my_string(file_path):
    f=open(file_path,'r')
    data=f.read()
    f.close()
    filtered_data=filter(onlyascii, data)
    filtered_data = filtered_data.lower()
    return filtered_data

위 내용은 마침표와 공백을 유지하면서 ASCII가 아닌 문자를 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.