ホームページ  >  記事  >  バックエンド開発  >  奇妙なクロール結果を解決するにはどうすればよいですか?

奇妙なクロール結果を解決するにはどうすればよいですか?

WBOY
WBOYオリジナル
2016-06-13 13:37:51706ブラウズ

奇妙なクロール結果
ページ http://www.sctport.com.cn/newsctsite/sct/cntrnoplan.jsp?ToPage=1 のテーブル コンテンツをクロールしたいのですが、不思議です。なぜそれしかクロールできないのですか中国語部分と英語部分をキャプチャすることはできませんか?とても奇妙です。 SNOOPY クラスを使用すると、コードは次のようになります。 専門家の方、助けてください。とても落ち込んでいます。

include("Snoopy.class.php");
$snoopy = 新しいスヌーピー;
$snoopy->fetch("http://www.sctport.com.cn/newsctsite /sct/cntrnoplan.jsp?ToPage=1");
preg_match_all('/(.*?)/i',$snoopy->結果,$d);
for ($i=0;$i echo $i; echo "----";
ECHO $d[1][$ i]."
";
}

中国語部分だけがキャプチャされ、英語部分と日付がキャプチャされませんでした。何が起こっているのかわかりません。

-----解決策---------

ディスカッション
PHP コード
$str=file_get_contents('http://www.sctport.com.cn/newsctsite/sct/cntrnoplan.jsp ?ToPage=1');
preg_match_all('/(.*?)/is',$str,$matches);
print_r( $matches);

------解決策---------
preg_match_all('/(.*)/isU',$snoopy->results,$d);
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。