//HTML を収集
function getwebcontent($url){
$ch =curl_init()
curl_setopt($ch, CURLOPT_URL, $ url); ;
curl _close ($ch);
return $contents;
//タイトルとURLを取得
$string =
getwebcontent('http://www.***.com/learn/zhunbeihuaiyun/jijibeiyun /2') ;
//通常のマッチ
タイトルとアドレスを取得
preg_match_all("/(.*)< /a> /",$string, $out, PREG_SET_ORDER);
foreach($out as $key => $value){
$article['title'][] = $out[$key][2] ;
$article['link'][] = "http://www.***.com/learn/article/".$out[$key][1]
}
//記事のコンテンツを取得url
foreach ($article['link'] as $key=>$value){
$content_html = getwebcontent($article['link'][$key]);
preg_match("/$article[content][$key] = $matches[0];
}
//いいえ、トランスコーディングは実際にはファイルに保存できません
foreach($article[title] as $key=>$value){
$article[title][$key] = iconv('utf-8', 'gbk', $ value);//トランスコーディング
}
//ファイルに保存
$num = count($article['title'])
for($i=0; $ifile_put_contents ("{$article[title][$i]}.txt", $article['content'][$i]);
http://www.bkjia.com/PHPjc/321079.html
www.bkjia.com
true
http://www.bkjia.com/PHPjc/321079.html技術記事
次のようにコードをコピーします。 //Collect html function getwebcontent($url){ $ch =curl_init(); $timeout = 10;curl_setopt($ch, CURLOPT_RETURNTRANSFER...)