문자열에서 인쇄할 수 없는 문자 이스케이프
소개:
텍스트 데이터를 처리할 때, 저장, 표시 또는 작업 중에 문제를 일으킬 수 있는 인쇄할 수 없는 특정 문자를 제거해야 하는 경우가 많습니다. 처리. 이러한 문자를 효율적으로 제거하는 방법을 이해하는 것이 중요합니다.
해결책:
인쇄할 수 없는 문자(0-31 및 127)를 제거하려면 다음 옵션을 고려하십시오. 문자열 인코딩:
1. 7비트 ASCII:
$string = preg_replace('/[\x00-\x1F\x7F-\xFF]/', '', $string);
2. 8비트 확장 ASCII:
$string = preg_replace('/[\x00-\x1F\x7F]/', '', $string);
3. UTF-8:
$string = preg_replace('/[\x00-\x1F\x7F]/u', '', $string);
4. str_replace를 사용하는 대안:
$badchar = [...]; // Array of non-printable characters $string2 = str_replace($badchar, '', $str);
벤치마킹:
preg_replace와 str_replace의 성능은 문자열 길이와 유형에 따라 다릅니다. 특정 사례에 대한 최적의 접근 방식을 결정하려면 자체 데이터를 벤치마킹하는 것이 좋습니다.
유니코드는 어떻습니까?
인쇄할 수 없는 특정 유니코드 문자(예: NO-Break Space), 문자 클래스 내에서 xA0을 사용하십시오:
$string = preg_replace('/[\x00-\x1F\x7F\xA0]/u', '', $string);
위 내용은 다양한 인코딩의 문자열에서 인쇄할 수 없는 문자를 효율적으로 제거하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!