>백엔드 개발 >PHP 튜토리얼 >단어 경계를 유지하면서 PHP에서 UTF-8 문자열을 안전하게 자르는 방법은 무엇입니까?

단어 경계를 유지하면서 PHP에서 UTF-8 문자열을 안전하게 자르는 방법은 무엇입니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2024-12-18 16:23:11380검색

How to Safely Truncate UTF-8 Strings in PHP While Preserving Word Boundaries?

UTF-8 문자로 문자열 자르기

문제:
멀티바이트 문자열을 지정된 문자 제한까지 자르기 PHP에서는 단어 경계를 유지하는 것이 어려울 수 있습니다. 이 문제는 멀티바이트 문자와 일관되게 작동해야 하는 truncate()라는 사용자 정의 메서드를 사용하여 이 기능을 구현하는 것과 관련이 있습니다.

해결 단계:

  1. 최대값 결정 원하는 최대 길이에서 종료 문자열의 길이를 뺀 문자 길이.
  2. 문자열의 길이를 확인하세요. 최대 길이를 초과합니다. 그렇지 않은 경우 변경하지 않고 반환합니다.
  3. 단어 경계를 설정하려면 최대 길이 아래의 마지막 공백 문자를 식별합니다.
  4. 마지막 공백 또는 공백이 없는 경우 최대 길이에서 문자열을 자릅니다. 존재합니다.
  5. 잘린 문자열에 종료 문자열을 추가합니다.
  6. 수정된 문자열을 반환합니다. string.

mb_strimwidth()를 사용하는 솔루션:

PHP는 멀티바이트 문자열 잘림을 처리할 수 있는 mb_strimwidth() 함수를 제공합니다. 그러나 이 함수는 단어 경계를 따르지 않습니다. 다음 코드 조각은 사용법을 보여줍니다.

public function truncate($string, $chars = 50, $terminator = ' …')
{
    $maxChars = $chars - strlen($terminator);
    if (mb_strlen($string) <= $maxChars) {
        return $string;
    }

    $lastWhitespace = mb_strrpos(mb_substr($string, 0, $maxChars), ' ');
    if ($lastWhitespace !== false) {
        return mb_substr($string, 0, $lastWhitespace) . $terminator;
    } else {
        return mb_substr($string, 0, $maxChars) . $terminator;
    }
}

위 내용은 단어 경계를 유지하면서 PHP에서 UTF-8 문자열을 안전하게 자르는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.