>백엔드 개발 >PHP 튜토리얼 >다양한 인코딩의 문자열에서 인쇄할 수 없는 문자를 효율적으로 제거하려면 어떻게 해야 합니까?

다양한 인코딩의 문자열에서 인쇄할 수 없는 문자를 효율적으로 제거하려면 어떻게 해야 합니까?

Linda Hamilton
Linda Hamilton원래의
2024-12-28 15:04:10285검색

How Can I Efficiently Remove Non-Printable Characters from Strings in Different Encodings?

문자열에서 인쇄할 수 없는 문자 이스케이프

소개:

텍스트 데이터를 처리할 때, 저장, 표시 또는 작업 중에 문제를 일으킬 수 있는 인쇄할 수 없는 특정 문자를 제거해야 하는 경우가 많습니다. 처리. 이러한 문자를 효율적으로 제거하는 방법을 이해하는 것이 중요합니다.

해결책:

인쇄할 수 없는 문자(0-31 및 127)를 제거하려면 다음 옵션을 고려하십시오. 문자열 인코딩:

1. 7비트 ASCII:

$string = preg_replace('/[\x00-\x1F\x7F-\xFF]/', '', $string);

2. 8비트 확장 ASCII:

$string = preg_replace('/[\x00-\x1F\x7F]/', '', $string);

3. UTF-8:

$string = preg_replace('/[\x00-\x1F\x7F]/u', '', $string);

4. str_replace를 사용하는 대안:

$badchar = [...]; // Array of non-printable characters
$string2 = str_replace($badchar, '', $str);

벤치마킹:

preg_replace와 str_replace의 성능은 문자열 길이와 유형에 따라 다릅니다. 특정 사례에 대한 최적의 접근 방식을 결정하려면 자체 데이터를 벤치마킹하는 것이 좋습니다.

유니코드는 어떻습니까?

인쇄할 수 없는 특정 유니코드 문자(예: NO-Break Space), 문자 클래스 내에서 xA0을 사용하십시오:

$string = preg_replace('/[\x00-\x1F\x7F\xA0]/u', '', $string);

위 내용은 다양한 인코딩의 문자열에서 인쇄할 수 없는 문자를 효율적으로 제거하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.