ASP.NET의 문자열에서 HTML 태그 제거
ASP.NET에서는 다음 방법을 통해 문자열에서 HTML 태그를 제거할 수 있습니다.
정규식 대체 방법에는 몇 가지 제한 사항이 있지만 문자열에서 HTML 태그를 안정적으로 제거할 수 있습니다.
"1*(>|$)"를 찾아서 바꿉니다.
"[srn]"을 단일 공백으로 바꿔 문자열을 정규화합니다.
결과 문자열에서 선행 및 후행 공백을 제거합니다.
예:
입력 = "
" 청소 = Regex.Replace(입력, "1*(>|$)").Normalize().Trim() Console.WriteLine(cleaned); // 출력: "안녕하세요"
참고: 이 방법은 속성 값에 ">"가 포함된 HTML/XML을 발견할 때 제한이 있습니다.
다음과 같은 성숙한 HTML 구문 분석 라이브러리 사용을 고려해보세요.
이러한 라이브러리는 포괄적이고 사용자 정의 가능한 HTML 구문 분석 및 정리 기능을 제공합니다.
예(HTMLAgilityPack 사용):
HtmlAgilityPack 사용; ... HtmlDocument doc = new HtmlDocument(); doc.LoadHtml(입력); Console.WriteLine(doc.DocumentNode.InnerText); // 출력: "안녕하세요"
위 내용은 ASP.NET의 문자열에서 HTML 태그를 효과적으로 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!