1>0
に圧縮されるのではなく、保持される必要があります。
<p>これにはいくつかの正規表現が必要になる場合がありますが、問題ありません</p>
<p>いくつかのことがあります:</p>
<p><code><\s?\/\s*</code> これにより、部分的に <code></ b></ div ></code> が < code> に修正されます。 ;</b></div></code> ですが、残りは現在作業中です< /p>
<p>たとえば、思い切ったアプローチを取ることもできますが、そうするとラベル名自体ではなく、ラベル テキスト部分内のコードも壊れてしまいます</p>P粉3230507802023-09-03 16:42:37
あなたが投稿したものと同じように破損したドキュメントを保存する合理的な方法はありませんが、テキスト内の # および類似の文字を関連するエンティティに置き換えると仮定します。例:
> ;
の場合、受け入れたいドキュメントを、残りを処理する DomDocument などの適切なライブラリに入れることができます。
出力:
リーリーP粉0644484492023-09-03 11:17:47
次の正規表現も有効です:
HTMLタグ内の有効部分を4つに分割し、残りの部分(スペース)をそれらに置き換えます。
/(<)\s*(\/?)\s*([^<>]*\S)\s*(>)/g
(<)<)
- 開始山かっこをキャプチャします (セクション 1) \s*
- 任意の空白文字と一致します(\/?)
- オプションのバックスラッシュのキャプチャ (パート 2)\s*
- バックスラッシュの後の任意のスペースと一致します([^<>]*\S)
- 末尾のスペースなしでタグ内のコンテンツをキャプチャします (セクション 3) \s*
- コンテンツの後および閉じ山括弧前のスペースと一致します(>)
- 直角括弧のキャプチャ (セクション 4)