この記事は、ニュース Web ページのバッチからテキストを抽出する小さなプログラムです。各ニュース記事の内容を、ニュース タイトルをファイル名としてテキスト ファイルとして保存できます。より良い解決策がある場合は、私に連絡してください:
lwx3069@sina.com
People's Daily Online の「今日のニュース」のニュースを例として挙げます
($url) "" : $ url = "http://www.unn.com.cn/GB/channel2/3/11/index.html"; // 今日のニュース
if(isset($url)&&$url!="") {
$ str = implode("",file($url));
$str_ary =explode("
",$str);
$str_ary =explode("- ",trim($str_ary[1])); ($i=0; $iif (strlen(trim($str_ary[$i]))Continue; }
echo "ニュース".$i." : ".$str_ary[$i];
$str1=strstr("$str_ary[$i]",$str2=strstr("$str_ary[$i]"," target);
$len1=strlen(" $ str1");
$len2=strlen("$str2");
$len=$len1-$len2;
$url=substr("$str1",10,$len-10);
if (strlen (トリム($url))!=0) {
$url = "http://www.unn.com.cn/".$url;
define(CONTENTS_DIR,"./contents/"); ($url)&&$url!="") {
$str = implode("",file($url));
$str1=explode(,$str); Part
,$str1[1]); //ファイルの下の部分を取り出し、不要な下部分を削除すると、得られるものはすべて役に立ちます
$str3 =explode(
,$str2[0]); // 有用な部分全体からファイルのタイトルとテキストを取得します$str4=explode(,$str2[0]) // 日付と時刻を取得します $str5=explode(
,$str3[1]); //タイトルと本文部分からタイトルを取得します $title=str_replace("","",$str5[0]); str3=explode(
,$str2[0]); //有用な部分全体からファイルテキストを取得します
$str3[1]=str_replace(
,"
"." ",$str3[1]); $str3[1]=str_replace( ,"",$str3[1]);
$str3=strip_tags($str3[1]);
$pf=trim ($title).".txt";
$ppf=fopen(CONTENTS_DIR."$pf",w);
fputs($ppf,"$str4[0]"); ;
fputs($ppf,$str3)
}
}
}
}
?>
http://www.bkjia.com/PHPjc/532189.htmlwww.bkjia.com
truehttp://www.bkjia.com/PHPjc/532189.html技術記事この記事は、ニュース Web ページのバッチからテキストを抽出する小さなプログラムで、各ニュース記事の内容をニュース タイトルをファイル名としてテキスト ファイルとして保存できます。もっと良い対処法があれば...