>백엔드 개발 >PHP 튜토리얼 >태그를 깨지 않고 포함된 HTML로 텍스트를 자르는 방법은 무엇입니까?

태그를 깨지 않고 포함된 HTML로 텍스트를 자르는 방법은 무엇입니까?

Linda Hamilton
Linda Hamilton원래의
2024-11-10 04:37:02804검색

How to Truncate Text with Embedded HTML Without Breaking Tags?

삽입된 HTML로 텍스트 자르기

HTML 태그가 포함된 텍스트를 처리할 때 태그가 깨지거나 잘리는 것을 방지하려면 잘림 중에 올바르게 처리하는 것이 중요합니다. 잘못된 콘텐츠를 표시합니다. HTML의 무결성을 유지하면서 텍스트를 자르는 방법은 다음과 같습니다.

PHP 구현:

다음 PHP 함수는 정규식을 사용하여 HTML을 구문 분석하고 열린 스택을 유지 관리합니다. 태그:

function printTruncated($maxLength, $html, $isUtf8 = true) { ... }

이 함수는 HTML 입력을 검색하여 태그와 문자 엔터티를 식별합니다. 태그가 제대로 닫혔는지 확인하고 문자 엔터티를 단일 문자로 계산합니다. 이 접근 방식을 사용하면 HTML 구조를 손상시키지 않고 유효한 지점에서 잘림이 발생합니다.

사용 예:

printTruncated(10, '<b><Hello&amp;gt;</b> <img src="world.png" alt="" /> world!'); // Outputs: 'Hello<b></b> <img src="world.png" alt="" />'

Python 구현:

BeautifulSoup과 같은 HTML 구문 분석 라이브러리는 다음에서 이 작업을 지원할 수 있습니다. Python:

from bs4 import BeautifulSoup, NavigableString

def truncate_html(text, max_length):
    soup = BeautifulSoup(text, 'lxml')
    truncated = soup.new_tag("div")
    tail = soup.new_string('')

    node_len = 0
    for node in soup.children:
        if isinstance(node, NavigableString):
            node_len += len(node)
            if node_len <= max_length:
                truncated.append(node)
            else:
                tail.append(node.string[:max_length - node_len])
                break
        else:
            node_len += len(str(node))
            truncated.append(node)
        
    return str(truncated) + str(tail)

사용 예:

print(truncate_html('<b><Hello&amp;gt;</b> <img src="world.png" alt="" /> world!', 10)) # Outputs: 'Hello<b></b> <img src="world.png" alt="" />'

결론:

처리하는 동안 HTML 태그를 구문 분석하고 처리하여 잘림을 방지하는 방법으로 결과 텍스트가 의도한 구조와 내용을 유지하도록 보장합니다. 유효합니다.

위 내용은 태그를 깨지 않고 포함된 HTML로 텍스트를 자르는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.