PHP
1로 웹 콘텐츠 가져오기에 대한 참고 사항 네트워크 오류가 발생하며 오류가 발생할 수 있습니다. 예를 들어, 컴퓨터가 다운되고, 네트워크 케이블이 끊어지고, 도메인 이름이 잘못되고, 네트워크 시간이 초과되고, 페이지가 사라지고, 웹사이트가 점프하고, 서비스가 금지되고, 호스트 로드가 충분하지 않습니다...
2. 서버에 일반적인 검색 서버 액세스만 허용하는 제한 사항이 추가되었습니다
3. 서버에 핫링크 방지 제한 사항이 추가되었습니다
4. 일부 웹사이트에서는 HTTP에 Accept-Encoding 헤더가 있는지 여부에 관계없이 항상 gzip을 보냅니다. 요청 또는 헤더의 특정 콘텐츠.
5. URL 링크는 중국어 문자를 포함하여 모든 종류가 이상하며 일부 웹사이트에는 캐리지 리턴 및 라인 피드가 있습니다.
6. HTTP 헤더에 있고 웹 페이지에 여러 Content-Type이 있으며 더욱 심각한 것은 각 Content-Type이 다르다는 것입니다. 가장 심각한 것은 이러한 Content-Type이 사용되는 Content-Type이 아닐 수도 있다는 것입니다.
7. 네트워크 링크가 매우 느리고 분석이 수천 페이지 시간입니다. 맛있는 식사를 하시기 바랍니다
PHP에서 웹 콘텐츠를 얻는 방법
방법 1 , file_get_contents 메소드를 사용하여 구현
$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml"; $html = file_get_contents($url); //如果出现中文乱码使用下面代码 //$getcontent = iconv("gb2312", "utf-8",$html); echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>";
방법 2, 컬을 사용하여 구현
$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml"; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); $html = curl_exec($ch); curl_close($ch); echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>"; curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
이 코드를 추가한다는 것은 요청이 리디렉션되면 최종 요청 페이지에 액세스할 수 있음을 의미합니다. 그렇지 않으면 요청 결과에 다음이 표시됩니다. 다음 콘텐츠:
<head><title>Object moved</title></head> <body><h1>Object Moved</h1>This object may be found <a href="some link." rel="external nofoll
추천 튜토리얼: PHP 비디오 튜토리얼
위 내용은 PHP로 웹 콘텐츠를 가져올 때 주의해야 할 점은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!