<p> <img src="https://img.php.cn/upload/article/000/000/000/173777503111682.jpg" alt="How to Remove HTML Tags from a Document Using C# Regular Expressions?
">
</p>
<c> c#正規表現を使用してHTMLタグを削除しますHTMLコンテンツを処理する場合、データの抽出またはテキスト分析にはラベルの削除が不可欠です。 1つの方法は、C#正規表現を使用してこのタスクを実行することです。 <strong>
</strong> 質問:<sulice> c#正規式を使用して、HTMLドキュメントからすべてのHTMLタグ(括弧を含む)を削除する方法は?
<p>コード:</p>
<p>
<strong>
</strong>説明:</p>
<p>
<strong>
</strong>正規表現モード</p>
<pre class="brush:php;toolbar:false"><code class="language-csharp">string htmlDocument = @"<p><b>Example text</b> containing tags</p>";
string result = Regex.Replace(htmlDocument, @"<[^>]*>", String.Empty);
Console.WriteLine(result); // 输出:Example text containing tags</code></pre>の最後のラベル(変更記号を除く)を一致させます。 <p>
<strong>メソッドは、すべてのマッチングモードを空の文字列に置き換えます。 </strong>
</p>このメソッドは、Spriteブラケットを含むHTMLドキュメントからすべてのタグを効果的に削除します。 <ul>
<li>
<code><[^>]*></code>注:<code><</code> <code>></code>
</li>通常の式は有用ですが、HTMLまたはXMLドキュメントを処理するときに制限があることに注意する必要があります。それらは、ネストされた構造を効果的に処理することはできません。これは、場合によっては予期しない結果につながる可能性があります(スプライトブラケットを含むCDATAなど)。 したがって、複雑なHTML構造の場合、より強力なHTMLパーサーを使用することをお勧めします。 <li>
</ul></sulice></c>
以上がC#正規式を使用してドキュメントからHTMLタグを削除する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。