>백엔드 개발 >C++ >ASP.NET의 문자열에서 HTML 태그를 효과적으로 제거하는 방법은 무엇입니까?

ASP.NET의 문자열에서 HTML 태그를 효과적으로 제거하는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2025-01-11 22:11:48452검색

How to Effectively Remove HTML Tags from Strings in ASP.NET?

ASP.NET의 문자열에서 HTML 태그 제거

ASP.NET에서는 다음 방법을 통해 문자열에서 HTML 태그를 제거할 수 있습니다.

정규식 대체

정규식 대체 방법에는 몇 가지 제한 사항이 있지만 문자열에서 HTML 태그를 안정적으로 제거할 수 있습니다.

  1. "1*(>|$)"를 찾아서 바꿉니다.

  2. "[srn]"을 단일 공백으로 바꿔 문자열을 정규화합니다.

  3. 결과 문자열에서 선행 및 후행 공백을 제거합니다.

예:

입력 = "

  • 안녕하세요

" 청소 = Regex.Replace(입력, "1*(>|$)").Normalize().Trim() Console.WriteLine(cleaned); // 출력: "안녕하세요"

참고: 이 방법은 속성 값에 ">"가 포함된 HTML/XML을 발견할 때 제한이 있습니다.

외부 라이브러리 사용

다음과 같은 성숙한 HTML 구문 분석 라이브러리 사용을 고려해보세요.

  • HTMLAgilityPack
  • HtmlSanitizer
  • 정수기

이러한 라이브러리는 포괄적이고 사용자 정의 가능한 HTML 구문 분석 및 정리 기능을 제공합니다.

예(HTMLAgilityPack 사용):

HtmlAgilityPack 사용; ... HtmlDocument doc = new HtmlDocument(); doc.LoadHtml(입력); Console.WriteLine(doc.DocumentNode.InnerText); // 출력: "안녕하세요"

---
  1. >

위 내용은 ASP.NET의 문자열에서 HTML 태그를 효과적으로 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.