>  기사  >  백엔드 개발  >  태그를 왜곡하지 않고 HTML 텍스트를 자르는 방법은 무엇입니까?

태그를 왜곡하지 않고 HTML 텍스트를 자르는 방법은 무엇입니까?

Barbara Streisand
Barbara Streisand원래의
2024-11-11 16:40:02549검색

How to Truncate HTML Text Without Distorting Tags?

태그 왜곡 없이 HTML 텍스트 자르기

태그의 유효성을 유지하면서 HTML이 포함된 텍스트를 자르는 것은 웹 개발의 일반적인 요구 사항입니다. . 그러나 문자열 잘림을 직접 적용하면 닫히지 않은 태그로 인해 텍스트의 왜곡되거나 불완전한 섹션이 발생하는 경우가 많습니다.

정확한 잘림을 위한 HTML 구문 분석

한 가지 효과적인 방법 해결책은 HTML을 구문 분석하고 태그 열기 및 닫기를 신중하게 처리하는 것입니다. 이렇게 하면 잘린 최종 텍스트의 구조적 무결성이 유지됩니다. 단계별 접근 방식은 다음과 같습니다.

  1. 열린 태그 추적: HTML을 구문 분석하는 동안 발견된 열린 태그 스택을 유지 관리합니다.
  2. 인쇄 텍스트 조각: HTML을 반복하고 태그 앞에 오는 텍스트 조각을 인쇄합니다.
  3. HTML 엔터티 및 멀티바이트 시퀀스 처리: 엔터티(예: <, &) 및 UTF -8 인코딩된 시퀀스는 전체 문자 표현을 보존하기 위해 처리되고 변경되지 않은 채 전달됩니다.
  4. 여는 태그 처리: 여는 태그가 발견되면 태그 스택으로 푸시됩니다. 자체 닫는 태그는 직접 인쇄됩니다.
  5. 닫는 태그 처리: 닫는 태그가 발견되면 해당 태그가 태그 스택에서 팝되고 해당하는 여는 태그가 올바르게 중첩되었는지 확인됩니다. 닫는 태그가 인쇄됩니다.
  6. 나머지 태그 닫기: 전체 HTML을 구문 분석한 후 스택에 남아 있는 모든 열린 태그가 역순으로 닫힙니다.

HTML 인식 잘림의 PHP 구현

다음 PHP 함수는 태그를 유지하면서 HTML 텍스트를 자르는 방법을 보여줍니다.

function printTruncated($maxLength, $html, $isUtf8 = true) {
    // ... Function logic goes here
}

사용 예

printTruncated(10, '&lt;Hello&gt;  world!'); // Output: "  world!"

결론

HTML을 구문 분석하고 태그를 적절하게 처리하면 구조적 무결성을 유지하면서 텍스트를 자를 수 있습니다. 이렇게 하면 링크, 서식 및 기타 HTML 요소가 보존되어 더욱 정확하고 의미 있는 사용자 경험을 제공할 수 있습니다.

위 내용은 태그를 왜곡하지 않고 HTML 텍스트를 자르는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.