jsからhtmlを削除する方法

PHPz
PHPzオリジナル
2023-04-21 14:13:114773ブラウズ
<p>JavaScript は、もともと Web ページとのユーザー インタラクションを改善するために作成された高水準プログラミング言語です。Web ページでは、HTML が Web ページ内のマークアップとコンテンツを定義するために使用される基本言語であり、JavaScript はこれらのマークとコンテンツを制御するために使用されます。 </p> <p>しかし、場合によっては、Web サイトをクロールしたり、テキストの長さを計算したりするなど、HTML タグを削除してプレーン テキストを取得する必要があります。現時点では、JavaScript を使用して HTML タグを削除できます。 </p> <p>この記事では、JavaScript を使用して HTML タグを削除する方法を紹介し、いくつかの一般的な方法とテクニックも提供します。 </p> <p>1. 正規表現を使用して HTML タグを削除する</p> <p>JavaScript で正規表現を使用するのは一般的な方法であり、正規表現を使用して HTML タグを削除できます。基本的な例を次に示します。 </p> <pre class="brush:php;toolbar:false">function stripHtml(html) {     return html.replace(/<[^>]+>/g,''); }</pre> <p> この関数では、正規表現 <code>/<[^>] >/g</code> を使用して、すべての HTML タグを削除します。この正規表現の意味は、「<code><</code> で始まり <code>></code> で終わるすべてに一致し、<code><</code> または <code>&gt は存在​​しない」です。 ; 真ん中の</code>文字列」。 </p><p>2. サードパーティ ライブラリを使用して HTML タグを削除する</p><p> もう 1 つの方法は、サードパーティ ライブラリを使用することです。たとえば、Node.js では、Cheerio ライブラリを使用して HTML タグを削除できます。これは、HTML タグを削除する機能など、HTML ドキュメントを操作するための jQuery に似た構文を提供します。 </p><p>次は、Cheerio を使用して HTML タグを削除する例です。 </p><pre class="brush:php;toolbar:false">const cheerio = require(&#39;cheerio&#39;); function stripHtml(html) { const $ = cheerio.load(html); return $.text(); }</pre><p>この関数は、<code>cheerio.load</code> メソッドを使用して HTML ドキュメントをロードし、<code> を使用します。 $.text </code>プレーンテキストを取得するメソッド。 Cheerio は非常に便利で、jQuery と同様にさまざまなセレクターも提供します。 </p><p>3. ドキュメント ノードを走査して HTML タグを削除する</p><p>Web ページでは、HTML ドキュメントには通常多くのノードが含まれています (ノードとは、タグ、テキスト ノードなど、Web ページ内の要素です)。 。 JavaScript は DOM (Document Object Model) を使用してこれらのノードを操作できます。 </p><p>これらのノードを走査し、HTML タグを含むノードを削除し、最終的にプレーン テキストを取得できます。例を次に示します。 </p><pre class="brush:php;toolbar:false">function stripHtml(html) { const element = document.createElement(&#39;div&#39;); element.innerHTML = html; const nodes = element.childNodes; let result = &#39;&#39;; for(let i = 0; i < nodes.length; i++) { if(nodes[i].nodeType === 3) { result += nodes[i].textContent; } } return result; }</pre><p>この関数は、ダミーの <code><div></code> 要素を作成し、そこに HTML テキストを挿入します。次に、<code>childNodes</code> 属性を使用してすべての子ノードを反復処理し、各ノードがテキスト ノードであるかどうか (つまり、<code>nodeType</code> 属性が 3 であるかどうか) を確認します。テキスト ノードの場合、テキスト コンテンツが結果に追加されます。 </p> <p>4. 概要</p> <p>JavaScript は、HTML ドキュメント内のさまざまな要素を操作するために使用できる非常に強力なプログラミング言語です。この記事では、HTML タグを削除するための 3 つの方法 (正規表現、サードパーティ ライブラリ、およびドキュメント ノードのトラバース) を紹介しました。 </p> <p> これらの方法にはそれぞれ長所と短所がありますので、状況に応じて最適な方法を選択してください。 HTML タグを削除することは Web 開発では一般的な要件ですが、この記事で紹介した方法が皆様のお役に立てれば幸いです。 </p>

以上がjsからhtmlを削除する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。