ホームページ >バックエンド開発 >PHPチュートリアル >phpカールを使用してタオバオの商品ページをクロールするにはどうすればよいですか?神に答えを求めてください。 。超難しい感じがします。
これは私が書いたカール取得コードです。Tmall 製品を取得するのにも役立ちます。ただし、タオバオの商品ページはキャプチャできません。
<?php$url = "http://item.taobao.com/item.htm?id=16396503658";$ch = curl_init();curl_setopt($ch, CURLOPT_URL, $url);curl_setopt($ch, CURLOPT_HEADER, false);curl_setopt($ch, CURLOPT_TIMEOUT, 20);curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);$ret = curl_exec($ch);curl_close($ch);echo $ret;?>
タオバオ記述の動的読み込みを分析し、そのアドレスを取得する
分析方法。 。 CURLOPT_FOLLOWLOCATION は自動的に最後までジャンプしませんか?
ジャンプがある必要があるだけでなく、Cookie も渡す必要があります
Curl は対象ページの HTML コードを取得することしかできず、その中の JS プログラムを実行することはできません
そしてページのキーデータも js Produced
を介して渡されます。 。 。 。 。今はページを取得することさえできません
Cookie を保存する方法
Cookie を保存するための特別な属性があります
CURLOPT_COOKIEJAR
http://item.taobao.com/item.htm?id=16396503658 を試してみましたが、空白でした開けたとき、どうやって手に入れたいですか?
プロダクト ID に問題があります...
http://item.taobao.com/item.htm?id=16396503658 を試してみましたが、開いてみると空白でした。どうやって取得しますか。 ?
プロダクト ID に問題があります...
開けますか?
ヘッダーがうまくシミュレートされていません
問題はヘッダーが適切にシミュレートされていないことです
HEADER をシミュレートする方法を教えてください。
http://item.taovao.com/item.htm?id=16396503658 を試してみましたが、開いてみると空白でした。どうやって取得しますか?
開いてもらえますか?
問題はヘッダーが適切にシミュレートされていないことです
HEADER をシミュレートする方法を教えてください。
同じリクエスト