検索
ホームページphp教程php手册php同时提取多条新闻中的文本一例

php同时提取多条新闻中的文本一例

Jun 13, 2016 am 10:24 AM
phpのためにそれ小さい抽出する文章ニュースプログラムウェブページ

本文为一个提取一批新闻网页中的文本的小程序,它可以将各篇新闻的内容存为以该新闻标题为文件名的文本文件。如有更好的处理方法,请和我联系:
lwx3069@sina.com
这里以人民网中的“今日要闻”下的新闻为例.
($url) ? "" : $url = "http://www.unn.com.cn/GB/channel2/3/11/index.html"; // 今日要闻
if(isset($url)&&$url!="") {
$str = implode("",file($url));
$str_ary = explode("

    ",$str);
    $str_ary = explode("
  • ",trim($str_ary[1]));
    for ($i=0; $iif (strlen(trim($str_ary[$i]))continue;
    }
    echo "新闻".$i.":".$str_ary[$i];
    $str1=strstr("$str_ary[$i]",$str2=strstr("$str_ary[$i]"," target);
    $len1=strlen("$str1");
    $len2=strlen("$str2");
    $len=$len1-$len2;
    $url=substr("$str1",10,$len-10);
    if (strlen(trim($url))!=0) {
    $url = "http://www.unn.com.cn/".$url;
    define(CONTENTS_DIR,"./contents/");
    if(isset($url)&&$url!="") {
    $str = implode("",file($url));
    $str1=explode(,$str); //去掉文件没用的上半部分

    $str2 = explode(

     

    ,$str1[1]);
    //取出文件的下半部分,并去掉没用的下半部分,这时得到的都是有用的
    $str3=explode(,$str2[0]); //从整个有用部分取出文件标题和正文
    $str4=explode(,$str2[0]); //取出日期和时间
    $str5=explode(
    ,$str3[1]); //从标题和正文部分取出标题
    $title=str_replace("
    ","",$str5[0]);
    $str3=explode(
    ,$str2[0]); //从整个有用部分取出文件正文
    $str3[1]=str_replace(
        ," "."  ",$str3[1]);
    $str3[1]=str_replace( ,"",$str3[1]);
    $str3=strip_tags($str3[1]);
    $pf=trim($title).".txt";
    $ppf=fopen(CONTENTS_DIR."$pf",w);
    fputs($ppf,$title);
    fputs($ppf,"$str4[0]");
    fputs($ppf,$str3);
    }
    }
    }
    }
    ?>
声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

WebStorm Mac版

WebStorm Mac版

便利なJavaScript開発ツール

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。