ASP.NET の文字列から HTML タグを削除します
ASP.NET では、次のメソッドを使用して文字列から HTML タグを削除できます。
正規表現による置換方法にはいくつかの制限がありますが、文字列から HTML タグを確実に削除できます。
「1*(>|$)」を検索して置換します。
「[srn]」を単一のスペースに置き換えて文字列を正規化します。
結果の文字列から先頭と末尾のスペースを削除します。
例:
入力 = "
」 clean = Regex.Replace(input, "1*(>|$)").Normalize().Trim() Console.WriteLine(cleaned) // 出力: "こんにちは"
注: 属性値に「>」を含む HTML/XML が見つかった場合、このメソッドには制限があります。
次のような成熟した HTML 解析ライブラリの使用を検討してください。
これらのライブラリは、包括的でカスタマイズ可能な HTML 解析およびサニタイズ機能を提供します。
例 (HTMLAgilityPack を使用):
HtmlAgilityPack を使用; ... HtmlDocument doc = new HtmlDocument(); doc.LoadHtml(入力); Console.WriteLine(doc.DocumentNode.InnerText); // 出力: "こんにちは"
以上がASP.NET の文字列から HTML タグを効果的に削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。