//ホームページのアドレスを収集します
$url="http://emotion.pclady.com.cn/skills/"; /ページコードを取得します
$rs=file_get_contents($url);
//一致する規則性を設定します
//$fp=fopen("text.txt","a");
//$fw=fwrite($fp) ,$rs);
//fclose($fp);
/*
href="http://emotion.pclady.com.cn/skills/0903/376476.html "
target=_blank> 善人をそばに置いておいてください*/
$preg='/
]+" >(.*)/i';
//通常の検索を実行
preg_match_all($preg,$rs,$title);
//数値を計算するタイトル数
$count=count ($title[0]);
echo $count."
";
//タイトル数ごとにコンテンツを収集
for ($i=0;$i<$count) ;$i++){
/ /コンテンツページのアドレスを設定します
$pr='/]+">/isU';
preg_match_all($pr,$title[0] [$i],$jurl) ;
$substr=substr($jurl[0][0],9);
//コンテンツページのコードを取得します
$c=file_get_contents($curl) ;
//通常のルールに一致するコンテンツ ページを設定します
$pc='/]+">/i'; search
preg_match($pc,$c ,$content);
//タイトルを出力
echo $title[0][$i]."
";
echo $title[1][$i]. "
";
$ concount=count($content[0]);
echo $concount."
"; ;$j
}
}
?>
検出後、$c はすでにコンテンツ ページのデータ ストリームですが、$pc の正規表現はなぜ< 文字だけでいいですか? はい、上記の subsrt() 関数を使用したためですか?他に何が問題ですか?アドバイスをいただけますか?