PHP에서 잘못된 문자를 잘라내는 것은 PHP의 문자열 함수가 기본적으로 멀티바이트로부터 안전하지 않기 때문입니다. 해결 방법은 잘못된 문자를 해결하기 위해 mb_trim 함수를 캡슐화하는 것입니다.
이 문서의 운영 환경: Windows 7 시스템, PHP 버전 7.4, Dell G3 컴퓨터.
PHP+트림의 잘못된 문제를 해결하는 방법은 무엇입니까?
PHP의 Trim은 잘못된 문자를 차단합니다
저는 Trim을 사용하여 문자열의 시작과 끝을 필터링했습니다. Trim에 대한 공식 설명:
trim - 시작과 끝에서 공백 문자(또는 기타 문자)를 제거합니다. of the string
오늘 하나를 찾았습니다. 매우 이상한 질문입니다. 코드는 다음과 같습니다.
<?php $str = '研发、产品、'; echo trim($str, '、');
이것이 무엇을 반환할지 추측해 보세요. "R&D, 제품"? 아니요, 이건 이상하게도 "R&D 및 생산"으로 돌아갑니다.
내 여는 방법이 잘못되어 잘못된 문자가 반환되는 이유는 무엇입니까?
몇 가지 테스트를 거친 후 매우 흥미로운 문제를 발견했습니다.
<?php echo trim('abacabb', 'ab'); //print 'c'
원래 acabb이 반환될 줄 알았는데 c만 반환되었습니다. 이는 트림 기능에 대한 오해입니다.
사실 이 예제는 공식 문서에서 볼 수 있지만 저는 주의를 기울이지 않았습니다.
trim은 문자열의 첫 번째 문자를 주기적으로 제거합니다. 위의 예에서와 같이 실행 과정은 다음과 같습니다.
문자열 abacabb은 아래 첨자 0부터 반복을 시작합니다. ab에 문자가 있으면 해당 문자가 제거됩니다. ab에 문자가 없으면 루프가 중지됩니다.
따라서 실행은 다음과 같습니다.
loop a는 문자열 ab에 존재하므로 이를 제거하고 나머지 bacabb
loop b는 문자열 ab에 존재하여 이를 제거하고 나머지 acabb
loop는 다음과 같습니다. a가 문자열 ab에 존재하므로 제거하고 cabb
를 남겨둡니다. 루프 c는 문자열 ab에 존재하지 않으므로 루프를 중지하므로 첫 번째 문자를 제거하고 cabb를 그대로 둡니다.
하지만 트림은 첫 번째 문자와 마지막 문자를 필터링하므로 루프의 끝에서도 제거됩니다. ㅋㅋㅋ 문자열 ab, 제거하고 나머지 c,
루프 c는 문자열 ab에 존재하지 않습니다. 루프를 중지하므로 터미널 문자를 제거한 후 c가 남습니다.
그래서 모든 작업이 끝나면 abacabb에는 c가 남습니다. 여기에서 트림 기능에 대해 어느 정도 이해하고 있습니다.
이는 PHP에서 문자열 함수가 기본적으로 멀티바이트로부터 안전하지 않기 때문입니다. 멀티바이트 안전이 필요한 경우 mb_ 시리즈 함수를 사용해야 합니다.
"품"의 16진수 코드는 0xe5 0x93 0x81입니다. 여기서 마지막 0x81은 일치하고 필터링됩니다. 이로 인해 문자가 깨질 수 있습니다.
.
PS: 저는 오랫동안 트림을 사용해왔지만, 한번도 제대로 이해한 적이 없습니다. 공식 문서를 읽는 것은 여전히 중요합니다.
추천 학습: "
PHP 비디오 튜토리얼"
위 내용은 PHP+문자 왜곡 문제를 해결하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!