작업 요구 사항으로 인해 다른 사람의 웹사이트에서 데이터를 크롤링해야 합니다. php 컬을 사용하지만 해결 방법이 없는 문제가 발생합니다
본토에는 신이 많다고 들었습니다. 저는 대만 출신인데 3일 동안 기사를 읽었습니다.
URL은 다음과 같습니다.
먼저 입력하세요.
http: //www .cbssports.com/mlb/scoreboard
그런 다음 아래에서 현재 플레이 중인 게임을 선택하고 GAMETRACKER를 클릭하세요. 생방송을 시청하실 수 있습니다
여기서 문제가 발생합니다
이 URL을 다음과 같이 사용하세요. 예: (보면 게임이 끝날지도 모릅니다)
ttp: //www.cbssports.com/mlb/gametracker/live/MLB_20140527_TB@TOR
제 동생이 작성한 프로그램은 다음과 같습니다. $game=array();
$ch = 컬_init ();
$search1=$_GET['searcharg'];
$url="http:// www.cbssports.com/mlb/gametracker/live/MLB_20140527_TB@TOR";
$cookie_jar =dirname(__FILE__)."/pic.cookie";
$ch = cur_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_USERAGENT,"Mozilla/5.0(Windows NT 6.1) AppleWebKit/536.11(KHTML, like Gecko )Chrome/20.0 .1132.57 Safari/536.11");
$data = cur_exec($ch);
curl_close($ ch);
preg_match_all('/
….( 문자열 구문 분석용)
현재 알려진 문제:
여부 "새 파일로 저장" 다른 이름으로 저장 또는 원본 파일 보기 , 일부 html 표시되지 않음 예:
원래 웹사이트는
> ~ ~ > ~
어쨌든 새 파일 또는
curl으로 저장된 웹페이지인 경우 결과는
현재 상황 리>
" & gt; HITTINGCHARTS & lt;/a & gt; & lt;/li & gt; ; & lt;/li & gt;
🎜>
trid="current-pitcher">
sports.cbsimg.net/images/baseball/mlb/players/60x80/no-photo-ava ilable.jpg
"border="0">< ;/td>
~ ~ | /a>
🎜>위의 파란색은 표시되지 않음을 의미합니다.
쿠키 ! 브라우저를 시뮬레이션 했지만 여전히 작동하지 않습니다.
본토의 신들 중 해결책이 있는지 궁금합니다. 길 좀 가르쳐 주세요(부탁)
|