収集した画像のimgタグにはJavaScriptスクリプトや無駄な情報が多く含まれていますので、altなど必要なものを置き換える必要があります。まず、フィルタリングするコンテンツを見てみましょう:
sdfsdfsdf
500){this.resize=true; this.style.width=500;}”>sfsdfsdfasdfsadf
500) {this.resize=true; this.style.width=500;}”>sdfsadf
500){this.resize =true;this.style.width=500;}">sdfsdf
ここで src=”http://www.xxx.com/upimg/080330 /120D1232295023X0.gif” src=”http://www.xxx.com/upimg/080330 /120D1232295023X0.gif”画像ではソースアドレス
が使用されているため、このアドレスは保持する必要があります。方法は大まかに次のとおりです。まず、コンテンツ内のすべての IMG タグを読み取り、次に各 IMG タグの SRC を抽出し、それを独自のコンテンツに結合し、最後に置き換えます。 。
preg_match_all は、正規表現によって一致するコンテンツの 3 次元配列を作成できる関数です。よくわからない場合は、マニュアルを確認してください。ここでは詳しく紹介しません。関数コード:
function replace($str)
{
preg_match_all(”/
]+>/isU”, $str, $arr);
for($i=0,$j=count($arr[0]);$i$str = str_replace($arr[0][$i],”
”,$str);
$str を返す
}