PHP가 기사를 수집하고 이미지가 표시되지 않는 문제에 대한 해결 방법: 1. 키워드를 기반으로 Baidu 검색 결과를 수집합니다. 2. 정의된 도메인 이름에 따라 수집된 HTML을 일괄 변환합니다.
이 글의 운영 환경: Windows 7 시스템, PHP 버전 7.1, DELL G3 컴퓨터
PHP로 수집한 사진이 표시되지 않으면 어떻게 해야 하나요?
PHP CURL 수집 Baidu 검색 결과 이미지가 표시되지 않는 문제 해결
1. 키워드 기반 Baidu 검색 결과 수집
키워드 기반 Baidu 검색 결과 수집은 컬을 사용하여 구현할 수 있으며 코드는 다음과 같습니다. :
<p><?php <br/>function doCurl($url, $data=array(), $header=array(), $timeout=30){<br> $ch = curl_init();<br> curl_setopt($ch, CURLOPT_URL, $url);<br> curl_setopt($ch, CURLOPT_HTTPHEADER, $header);<br> curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);<br> curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);<br> curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);<br> $response = curl_exec($ch);<br> if($error=curl_error($ch)){<br> die($error);<br> }<br> curl_close($ch);<br> return $response;<br>}<br>$wd = '仙剑奇侠传';<br>$url = 'http://www.baidu.com/s?wd='.urlencode($wd);<br>$data = array();<br>$header = array();<br>$response = doCurl($url, $data, $header, 5);<br>echo $response;<br>?><br></p>
내보낸 후 일부 사진이 표시되지 않는 것으로 나타났습니다
2. 수집된 사진이 표시되지 않는 이유 분석
바이두에서 직접 검색하면 해당 페이지에 사진이 표시됩니다. Firebug를 사용하여 이미지 경로를 확인하고 수집된 이미지의 도메인 이름이 Baidu에서 검색한 이미지의 도메인 이름과 다른지 확인합니다.
반환된 이미지 도메인 이름 t11.baidu.com
수집
일반 검색 이미지 도메인 이름 ss1.baidu.com
수집된 일반 검색 HTML과 도메인 이름에 대한 js를 확인하세요. 변환이 다릅니다
Collection
<p>var list = {<br> "graph.baidu.com": "http://graph.baidu.com",<br> "t1.baidu.com":"http://t1.baidu.com",<br> "t2.baidu.com":"http://t2.baidu.com",<br> "t3.baidu.com":"http://t3.baidu.com",<br> "t10.baidu.com":"http://t10.baidu.com",<br> "t11.baidu.com":"http://t11.baidu.com",<br> "t12.baidu.com":"http://t12.baidu.com",<br> "i7.baidu.com":"http://i7.baidu.com",<br> "i8.baidu.com":"http://i8.baidu.com",<br> "i9.baidu.com":"http://i9.baidu.com",<br>};<br></p>
일반 검색
<p>var list = {<br> "graph.baidu.com": "https://sp0.baidu.com/-aYHfD0a2gU2pMbgoY3K",<br> "t1.baidu.com":"https://ss0.baidu.com/6ON1bjeh1BF3odCf",<br> "t2.baidu.com":"https://ss1.baidu.com/6OZ1bjeh1BF3odCf",<br> "t3.baidu.com":"https://ss2.baidu.com/6OV1bjeh1BF3odCf",<br> "t10.baidu.com":"https://ss0.baidu.com/6ONWsjip0QIZ8tyhnq",<br> "t11.baidu.com":"https://ss1.baidu.com/6ONXsjip0QIZ8tyhnq",<br> "t12.baidu.com":"https://ss2.baidu.com/6ONYsjip0QIZ8tyhnq",<br> "i7.baidu.com":"https://ss0.baidu.com/73F1bjeh1BF3odCf",<br> "i8.baidu.com":"https://ss0.baidu.com/73x1bjeh1BF3odCf",<br> "i9.baidu.com":"https://ss0.baidu.com/73t1bjeh1BF3odCf",<br>};<br></p>
그러므로 Baidu는 소스 주소, IP, 헤더 및 기타 매개 변수를 기반으로 수집 여부를 결정하고 다른 js를 반환한다고 결론을 내릴 수 있습니다.
3. 수집 후 이미지가 표시되지 않는 문제 해결
수집된 HTML을 정의된 도메인 이름에 따라 일괄 변환하면 됩니다.
<p><?php <br/>function doCurl($url, $data=array(), $header=array(), $timeout=30){<br> $ch = curl_init();<br> curl_setopt($ch, CURLOPT_URL, $url);<br> curl_setopt($ch, CURLOPT_HTTPHEADER, $header);<br> curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);<br> curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);<br> curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);<br> $response = curl_exec($ch);<br> if($error=curl_error($ch)){<br> die($error);<br> }<br> curl_close($ch);<br> return $response;<br>}<br>// 域名转换<br>function cdomain($str){<br> $baidu_domain = '{<br> "http://graph.baidu.com": "https://sp0.baidu.com/-aYHfD0a2gU2pMbgoY3K",<br> "http://p.qiao.baidu.com":"https://sp0.baidu.com/5PoXdTebKgQFm2e88IuM_a",<br> "http://vse.baidu.com":"https://sp3.baidu.com/6qUDsjip0QIZ8tyhnq",<br> "http://hdpreload.baidu.com":"https://sp3.baidu.com/7LAWfjuc_wUI8t7jm9iCKT-xh_",<br> "http://lcr.open.baidu.com":"https://sp2.baidu.com/8LUYsjW91Qh3otqbppnN2DJv",<br> "http://kankan.baidu.com":"https://sp3.baidu.com/7bM1dzeaKgQFm2e88IuM_a",<br> "http://xapp.baidu.com":"https://sp2.baidu.com/yLMWfHSm2Q5IlBGlnYG",<br> "http://dr.dh.baidu.com":"https://sp0.baidu.com/-KZ1aD0a2gU2pMbgoY3K",<br> "http://xiaodu.baidu.com":"https://sp0.baidu.com/yLsHczq6KgQFm2e88IuM_a",<br> "http://sensearch.baidu.com":"https://sp1.baidu.com/5b11fzupBgM18t7jm9iCKT-xh_",<br> "http://s1.bdstatic.com":"https://ss1.bdstatic.com/5eN1bjq8AAUYm2zgoY3K",<br> "http://olime.baidu.com":"https://sp0.baidu.com/8bg4cTva2gU2pMbgoY3K",<br> "http://app.baidu.com":"https://sp2.baidu.com/9_QWsjip0QIZ8tyhnq",<br> "http://i.baidu.com":"https://sp0.baidu.com/74oIbT3kAMgDnd_",<br> "http://c.baidu.com":"https://sp0.baidu.com/9foIbT3kAMgDnd_",<br> "http://sclick.baidu.com":"https://sp0.baidu.com/5bU_dTmfKgQFm2e88IuM_a",<br> "http://nsclick.baidu.com":"https://sp1.baidu.com/8qUJcD3n0sgCo2Kml5_Y_D3",<br> "http://sestat.baidu.com":"https://sp1.baidu.com/5b1ZeDe5KgQFm2e88IuM_a",<br> "http://eclick.baidu.com":"https://sp3.baidu.com/-0U_dTmfKgQFm2e88IuM_a",<br> "http://api.map.baidu.com":"https://sp2.baidu.com/9_Q4sjOpB1gCo2Kml5_Y_D3",<br> "http://ecma.bdimg.com":"https://ss1.bdstatic.com/-0U0bXSm1A5BphGlnYG",<br> "http://ecmb.bdimg.com":"https://ss0.bdstatic.com/-0U0bnSm1A5BphGlnYG",<br> "http://t1.baidu.com":"https://ss0.baidu.com/6ON1bjeh1BF3odCf",<br> "http://t2.baidu.com":"https://ss1.baidu.com/6OZ1bjeh1BF3odCf",<br> "http://t3.baidu.com":"https://ss2.baidu.com/6OV1bjeh1BF3odCf",<br> "http://t10.baidu.com":"https://ss0.baidu.com/6ONWsjip0QIZ8tyhnq",<br> "http://t11.baidu.com":"https://ss1.baidu.com/6ONXsjip0QIZ8tyhnq",<br> "http://t12.baidu.com":"https://ss2.baidu.com/6ONYsjip0QIZ8tyhnq",<br> "http://i7.baidu.com":"https://ss0.baidu.com/73F1bjeh1BF3odCf",<br> "http://i8.baidu.com":"https://ss0.baidu.com/73x1bjeh1BF3odCf",<br> "http://i9.baidu.com":"https://ss0.baidu.com/73t1bjeh1BF3odCf",<br> "http://b1.bdstatic.com":"https://ss0.bdstatic.com/9uN1bjq8AAUYm2zgoY3K",<br> "http://ss.bdimg.com":"https://ss1.bdstatic.com/5aV1bjqh_Q23odCf",<br> "http://opendata.baidu.com":"https://sp0.baidu.com/8aQDcjqpAAV3otqbppnN2DJv",<br> "http://api.open.baidu.com":"https://sp0.baidu.com/9_Q4sjW91Qh3otqbppnN2DJv",<br> "http://tag.baidu.com":"https://sp1.baidu.com/6LMFsjip0QIZ8tyhnq",<br> "http://f3.baidu.com":"https://sp2.baidu.com/-uV1bjeh1BF3odCf",<br> "http://s.share.baidu.com":"https://sp0.baidu.com/5foZdDe71MgCo2Kml5_Y_D3", <br> "http://bdimg.share.baidu.com":"https://ss1.baidu.com/9rA4cT8aBw9FktbgoI7O1ygwehsv",<br> "http://1.su.bdimg.com":"https://ss0.bdstatic.com/k4oZeXSm1A5BphGlnYG",<br> "http://2.su.bdimg.com":"https://ss1.bdstatic.com/kvoZeXSm1A5BphGlnYG",<br> "http://3.su.bdimg.com":"https://ss2.bdstatic.com/kfoZeXSm1A5BphGlnYG",<br> "http://4.su.bdimg.com":"https://ss3.bdstatic.com/lPoZeXSm1A5BphGlnYG",<br> "http://5.su.bdimg.com":"https://ss0.bdstatic.com/l4oZeXSm1A5BphGlnYG",<br> "http://6.su.bdimg.com":"https://ss1.bdstatic.com/lvoZeXSm1A5BphGlnYG",<br> "http://7.su.bdimg.com":"https://ss2.bdstatic.com/lfoZeXSm1A5BphGlnYG",<br> "http://8.su.bdimg.com":"https://ss3.bdstatic.com/iPoZeXSm1A5BphGlnYG"<br> }';<br> $domain = json_decode($baidu_domain, true);<br> foreach($domain as $k=>$v){<br> $str = str_replace($k, $v, $str);<br> }<br> return $str;<br>}<br>$wd = '仙剑奇侠传';<br>$url = 'http://www.baidu.com/s?wd='.urlencode($wd);<br>$data = array();<br>$header = array();<br>$response = doCurl($url, $data, $header, 5);<br>echo cdomain($response); // 调用域名转换<br>?><br></p>
도메인 이름 변환을 추가하면 모든 사진이 정상적으로 표시됩니다.
추천 학습: "PHP 비디오 튜토리얼"
위 내용은 PHP가 기사 사진을 수집했지만 표시하지 않으면 어떻게 해야 할까요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!