HTML 内の N フィールド データを抽出するには、いくつかの特別なニーズがあります。
たとえば
<p class="test">
<p class="title">xxx</p>
<p class="xas"></p><pclass="asd"></p>
<p class="pic">xxx</p>
</p>
<p class="テスト">
<p class="title">xxx</p>
<p class="xas"></p><pclass="asd"></p>
<p class="pic">xxx</p>
</p>
HTML からタイトルと写真データを抽出する必要があります。正規表現はどのように記述すればよいですか?
真ん中の <p class="xas"></p><pclass="asd"></p> は別のコンテンツですが、このコンテンツは役に立たないので必要ありません。クロールしてみます
まだ始めたばかりですので、アドバイスをお願いします。