>웹 프론트엔드 >JS 튜토리얼 >일반 JavaScript만 사용하여 텍스트에서 HTML 태그를 제거하려면 어떻게 해야 합니까?

일반 JavaScript만 사용하여 텍스트에서 HTML 태그를 제거하려면 어떻게 해야 합니까?

Barbara Streisand
Barbara Streisand원래의
2024-12-25 10:23:14375검색

How Can I Remove HTML Tags from Text Using Only Plain JavaScript?

일반 JavaScript에서 HTML 태그 제거: 포괄적인 탐색

텍스트에서 HTML 태그를 제거하는 것은 다양한 프로그래밍 애플리케이션의 일반적인 요구 사항입니다. JavaScript는 이 작업을 수행하기 위해 여러 가지 내장 메서드와 라이브러리를 제공하지만, 이 기사에서는 외부 종속성 없이 순수한 JavaScript를 사용하여 이를 수행하는 복잡한 세부 사항을 자세히 설명합니다.

jQuery나 정규식 기반 솔루션과 같은 라이브러리가 없는 경우, 가장 간단한 접근 방식은 브라우저의 고유한 기능을 활용하여 HTML을 처리하는 것입니다. 임시 문서 조각을 생성하고 HTML을 innerHTML 속성에 할당하면 브라우저가 콘텐츠를 원활하게 구문 분석하고 태그 없이 텍스트를 반환합니다.

다음 JavaScript 함수는 이 접근 방식을 예시합니다.

function stripHtml(html) {
    let tmp = document.createElement("DIV");
    tmp.innerHTML = html;
    return tmp.textContent || tmp.innerText || "";
}

이 함수는 HTML 문자열을 입력으로 사용하고 일반 텍스트를 반환합니다. 그러나 잠재적으로 악성 코드 실행으로 이어질 수 있으므로 사용자 생성 HTML에서 이 방법을 사용하지 않는 것이 중요합니다.

이러한 시나리오의 경우 더 안전한 접근 방식은 도입된 API인 DOMParser를 활용하는 것입니다. HTML5:

function stripHtml(html) {
    const parser = new DOMParser();
    const document = parser.parseFromString(html, "text/html");
    return document.documentElement.textContent;
}

이 함수는 DOMParser를 사용하여 HTML 문자열에서 문서 객체를 생성한 다음 문서의 루트 요소에서 텍스트 콘텐츠를 추출합니다. 이 접근 방식은 입력에 대한 향상된 보안 및 제어를 제공하여 잠재적으로 신뢰할 수 없는 HTML을 처리하는 데 적합합니다.

적절한 기술 선택은 특정 사용 사례와 보안 고려 사항에 따라 다릅니다. 대부분의 시나리오에서 innerHTML을 사용하는 첫 번째 접근 방식은 단순성과 효율성을 제공합니다. 그러나 신뢰할 수 없는 입력을 처리하는 경우 보안과 신뢰성을 높이기 위해 DOMParser를 활용하는 것이 좋습니다.

위 내용은 일반 JavaScript만 사용하여 텍스트에서 HTML 태그를 제거하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.