新浪ニュース泥棒 1.< ;title>Sina_News クローラー$host="127.0.0.1"; // MYSQL ホスト名$namesql="????"; // MYSQL ユーザー名 $passsql="? ???"; // MYSQL パスワード$lib="news"; // データベース名$table="news"; // データベーステーブル名$filename=" http://news .sina.com.cn/news1000/index.shtml"; // 取得したニュースページ$keytop="ニュース開始"; // ニュース開始キーワード$keybottom=" ニュース終了"; // 終了ニュースキーワードの$conn=mysql_connect($host,$namesql,$passsql);mysql_select_db($lib,$conn);$ fp=fopen($filename, "r",1);$add=0; $temp[4]="; !$end==1){while(!$flag==1){$word=fgetc($fp);$add=$add.$ word;if( $word=='<' および strlen($add)==1){ $flag=0; }if($word=='<' および strlen($add )!=1){ $フラグ=1; $add=substr($add,0,strlen($add)-1); }if($word=='>'){ $flag=1 }if(strchr($add,$keytop)){ $found=1; }if(strchr($add,$keybottom)){ $end= 1; }if (((strchr($add,'<')==True および strchr($add,'href')==True) または strchr($add,'<')== False) および $found== 1){ $text[$i]=$i ; } if($word=='<' および $flag==1); else { $add=""; } }fclose($fp);for($i=1;$i$temp[1]=$text[$i 1]; $temp[2]=$text[$i 3]; temp[4]=$text[$i 4];$ins="select * from $table where TITLE='$temp[3]'";$list= mysql_query($ins,$conn ); @$count=mysql_num_rows($list);if($count==0){$ins="$table(TYPE,URL, TITLE,DATE) 値に挿入('$temp[1]','$temp[2]','$temp[3]','$temp[4]')";$list=mysql_query($ins ,$conn); } }mysql_close($conn);?> 2. $handle = fopen("http://news.sina.com.cn/news1000/","r"); $sign = 0;ハンドル)) { $message = fgets($handle,512); if($sign == 1) { print("$message" ); } if(ereg("ニュース開始",$message,$result)) { $sign = 1; } else if(ereg("ニュース終了",$メッセージ,$結果)) { $sign = 0; } } fclose($handle);