ホームページ >バックエンド開発 >PHPチュートリアル >複数のニュース項目から同時にテキストを抽出する例_PHP チュートリアル

複数のニュース項目から同時にテキストを抽出する例_PHP チュートリアル

WBOY
WBOYオリジナル
2016-07-13 17:23:59764ブラウズ

この記事は、ニュース Web ページのバッチからテキストを抽出する小さなプログラムです。各ニュース記事の内容を、ニュース タイトルをファイル名としてテキスト ファイルとして保存できます。より良い解決策がある場合は、私に連絡してください:
lwx3069@sina.com
People's Daily Online の「今日のニュース」のニュースを例として挙げます
($url) "" : $ url = "http://www.unn.com.cn/GB/channel2/3/11/index.html"; // 今日のニュース
if(isset($url)&&$url!="") {
$ str = implode("",file($url));
$str_ary =explode("

    ",$str);
    $str_ary =explode("
  • ",trim($str_ary[1])); ($i=0; $iif (strlen(trim($str_ary[$i]))Continue; }
    echo "ニュース".$i." : ".$str_ary[$i];
    $str1=strstr("$str_ary[$i]",$str2=strstr("$str_ary[$i]"," target);
    $len1=strlen(" $ str1");
    $len2=strlen("$str2");
    $len=$len1-$len2;
    $url=substr("$str1",10,$len-10);
    if (strlen (トリム($url))!=0) {
    $url = "http://www.unn.com.cn/".$url;
    define(CONTENTS_DIR,"./contents/"); ($url)&&$url!="") {
    $str = implode("",file($url));
    $str1=explode(,$str); Part

    $str2 =explode(

    ,$str1[1]);

    //ファイルの下の部分を取り出し、不要な下部分を削除すると、得られるものはすべて役に立ちます

    $str3 =explode(

    ,$str2[0]); // 有用な部分全体からファイルのタイトルとテキストを取得します$str4=explode(,$str2[0]) // 日付と時刻を取得します $str5=explode(

    ,$str3[1]); //タイトルと本文部分からタイトルを取得します
    $title=str_replace("","",$str5[0]); str3=explode(

    ,$str2[0]); //有用な部分全体からファイルテキストを取得します
    $str3[1]=str_replace(
    ," "." ",$str3[1]); $str3[1]=str_replace( ,"",$str3[1]);
    $str3=strip_tags($str3[1]);
    $pf=trim ($title).".txt";
    $ppf=fopen(CONTENTS_DIR."$pf",w);
    fputs($ppf,"$str4[0]"); ;
    fputs($ppf,$str3)
    }
    }
    }
    }
    ?>



    http://www.bkjia.com/PHPjc/532189.html

    www.bkjia.com

    http://www.bkjia.com/PHPjc/532189.html技術記事この記事は、ニュース Web ページのバッチからテキストを抽出する小さなプログラムで、各ニュース記事の内容をニュース タイトルをファイル名としてテキスト ファイルとして保存できます。もっと良い対処法があれば...
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。