ホームページ  >  記事  >  バックエンド開発  >  php file_get_contents がカールに変わり、淘宝網の製品属性を取得できるようになりますか?

php file_get_contents がカールに変わり、淘宝網の製品属性を取得できるようになりますか?

WBOY
WBOYオリジナル
2016-06-23 13:30:471172ブラウズ

クロールにcurlを使用するように次のコードを変更するにはどうすればよいですか?そしてそれを製品の IID で保存します

function get_shuxing($type,$iid){if($type=='tmall'){$text=file_get_contents("http://detail.tmall.com/item.htm?id=$iid");preg_match('|<ul id="J_AttrUL">(.*)</ul>|isU',$text, $match);}elseif ($type=='taobao'){$text=file_get_contents("http://item.taobao.com/item.htm?id=$iid");preg_match('|<ul class="attributes-list">(.*)</ul>|isU',$text, $match);}$match=$match[0];$match = iconv('gbk', 'utf-8', $match);echo $match;}


ディスカッションに返信 (解決策)

誰か助けてくれませんか

どうやってテストデータを提供する必要がありますか?何...

テストデータを提供しない場合、どうやって入手できますか? 何があっても $iid を提供する必要があります...



http://detail.tmall.com/item .htm?id=13317551791
大丈夫ですか!製品の製品パラメータを取得するだけです

$html=file_get_contents('http://detail.tmall.com/item.htm?id=13317551791');include 'simple_html_dom.php';//网上下一个 $dom=new simple_html_dom();// $html utf8才可以$dom->load($html);$names=$dom->find('select[id=js]');$res=array();$lis=$dom->find('ul[id=J_AttrUL] li');foreach($lis as $k=>$li){    $temp=$li->text();	list($key,$value)=explode(':',$temp);	$data[$key]=$value;}echo "<pre class="brush:php;toolbar:false">";print_r($data);echo "
";/*Array( [上市年份季节] => 2015年夏季 [裤长] => 长裤 [货号] => Y306 [颜色] => Y139蓝色 Y118蓝色偏小一码 Y139复古蓝 Y306黑蓝 深色Y306/蓝色 Y306浅蓝色 YN8601蓝色 Y007怀旧蓝 [尺码] => 40 38 36 34 33 32 31 30 29 28 [牛仔面料] => 常规牛仔布 [工艺处理] => 压皱 水洗 复古 商务 个性 潮牌 休闲 nzk 修身 漂白 猫须 破洞 雪花洗 手擦 磨边 刮烂 电磨 针缝 喷砂 赤耳 马骝 镶边 无工艺 扎花 刺绣 扎染 [品牌] => YYK [款式细节] => 立体剪裁 [上市时间] => 2013年 [适用季节] => 夏季 [适用对象] => 大码 [材质] => 棉涤 [弹力] => 无弹 [腰型] => 中腰 [裤脚口款式] => 直脚 [裤门襟] => 拉链 [洗水工艺] => 水洗 石洗/石磨 砂洗 石漂洗 漂染 碧纹洗 吊染 雪花洗 酵素洗 化学洗 [厚薄] => 薄款 [款式版型] => 合体直筒 [基础风格] => 时尚都市 [细分风格] => 日系复古)*/

$html=file_get_contents('http://detail.tmall.com/item.htm?id=13317551791');include 'simple_html_dom.php';//网上下一个 $dom=new simple_html_dom();// $html utf8才可以$dom->load($html);$names=$dom->find('select[id=js]');$res=array();$lis=$dom->find('ul[id=J_AttrUL] li');foreach($lis as $k=>$li){    $temp=$li->text();	list($key,$value)=explode(':',$temp);	$data[$key]=$value;}echo "<pre class="brush:php;toolbar:false">";print_r($data);echo "
";/*Array( [上市年份季节] => 2015年夏季 [裤长] => 长裤 [货号] => Y306 [颜色] => Y139蓝色 Y118蓝色偏小一码 Y139复古蓝 Y306黑蓝 深色Y306/蓝色 Y306浅蓝色 YN8601蓝色 Y007怀旧蓝 [尺码] => 40 38 36 34 33 32 31 30 29 28 [牛仔面料] => 常规牛仔布 [工艺处理] => 压皱 水洗 复古 商务 个性 潮牌 休闲 nzk 修身 漂白 猫须 破洞 雪花洗 手擦 磨边 刮烂 电磨 针缝 喷砂 赤耳 马骝 镶边 无工艺 扎花 刺绣 扎染 [品牌] => YYK [款式细节] => 立体剪裁 [上市时间] => 2013年 [适用季节] => 夏季 [适用对象] => 大码 [材质] => 棉涤 [弹力] => 无弹 [腰型] => 中腰 [裤脚口款式] => 直脚 [裤门襟] => 拉链 [洗水工艺] => 水洗 石洗/石磨 砂洗 石漂洗 漂染 碧纹洗 吊染 雪花洗 酵素洗 化学洗 [厚薄] => 薄款 [款式版型] => 合体直筒 [基础风格] => 时尚都市 [细分风格] => 日系复古)*/



それは可能ですが、私が望むものではありません、ありがとう

これらは製品パラメータではありませんか?データは取り出されていますが、それをどのように使用するかは、1次元か2次元かはわかりません。キーと値のペア?

正規表現を使用しないでください。これらの属性を取得するための http リクエスト メソッドがあることを覚えています

これは次のようなものですか?
りー

そうですか?

function get_shuxing($type,$iid){        if($type=='tmall'){                //$text=file_get_contents("http://detail.tmall.com/item.htm?id=$iid");                $text=use_curl("http://detail.tmall.com/item.htm?id=$iid");                preg_match('|<ul id="J_AttrUL">(.*)</ul>|isU',$text, $match);        }elseif ($type=='taobao'){                //$text=file_get_contents("http://item.taobao.com/item.htm?id=$iid");                $text=use_curl("http://item.taobao.com/item.htm?id=$iid");                preg_match('|<ul class="attributes-list">(.*)</ul>|isU',$text, $match);        }        $match=$match[0];        $match = iconv('gbk', 'utf-8', $match);        echo $match;}function use_curl($url){        $ch = curl_init($url);        curl_setopt($ch, CURLOPT_HEADER, 0);        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);        $output = curl_exec($ch);        curl_close($ch);        return $output;}get_shuxing('taobao',45098460735);



このように変更したいだけですが、tmall のパラメータを取得できないのですが、これを自分のものに戻すと正常に動作します

こんな感じでしょうか。

function get_shuxing($type,$iid){        if($type=='tmall'){                //$text=file_get_contents("http://detail.tmall.com/item.htm?id=$iid");                $text=use_curl("http://detail.tmall.com/item.htm?id=$iid");                preg_match('|<ul id="J_AttrUL">(.*)</ul>|isU',$text, $match);        }elseif ($type=='taobao'){                //$text=file_get_contents("http://item.taobao.com/item.htm?id=$iid");                $text=use_curl("http://item.taobao.com/item.htm?id=$iid");                preg_match('|<ul class="attributes-list">(.*)</ul>|isU',$text, $match);        }        $match=$match[0];        $match = iconv('gbk', 'utf-8', $match);        echo $match;}function use_curl($url){        $ch = curl_init($url);        curl_setopt($ch, CURLOPT_HEADER, 0);        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);        $output = curl_exec($ch);        curl_close($ch);        return $output;}get_shuxing('taobao',45098460735);


このように変更したいだけですが、tmall のパラメータを取得できません。これを自分のものに戻すと、正常に動作します。
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。