ホームページ > 記事 > ウェブフロントエンド > JavaScript Regex を使用して HTML から複数行のテキストを抽出する方法
JavaScript Regex を使用した HTML からの複数行テキストの抽出
JavaScript で正規表現を使用して HTML から文字列を取得しようとする場合、これは非常に重要です修飾子の互換性を考慮するため。あなたのシナリオでは、複数行フラグ (/m) に関する問題が発生しています。
Dotall 修飾子と JavaScript
この問題は、JavaScript が本質的に、「dotall」修飾子としても知られる /.../s 修飾子をサポートしています。この修飾子は、ドット (.) 文字を強制的に改行と一致させますが、通常は一致しません。
回避策の作成: 文字クラス
JavaScript の /s 修飾子では、文字クラス () とその否定 (S) を併用できます。このアプローチは、改行を含むあらゆる文字に効果的に一致します。
更新された正規表現構文
これを念頭に置いて、正規表現を次のように変更する必要があります:
/<div>
ES6 サポート
ですES2018 の時点で、JavaScript は「/s」 (dotAll) フラグをサポートしていることに注意してください。これは、より新しい環境では、「/m」フラグの代わりに「/s」フラグを使用して元の正規表現構文を使用できることを意味します。
/<div>
以上がJavaScript Regex を使用して HTML から複数行のテキストを抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。