>백엔드 개발 >PHP 튜토리얼 >DOM 왜곡 코드를 해결하는 PHP 방법

DOM 왜곡 코드를 해결하는 PHP 방법

墨辰丷
墨辰丷원래의
2018-05-30 16:18:131482검색

최근 직장에서 문제가 발생했는데, 문자가 깨져 나오는 문제를 발견했는데, 나중에 인터넷에서 정보를 검색해서 해결했습니다. 이제 관심 있는 친구들이 참고할 수 있도록 하겠습니다. , 도움이 필요한 친구들이 와서 함께 배웁니다.

머리말

DOM은 PHP에서 비교적 새로운 XML 및 HTML 처리 클래스로, DOM 트리를 JavaScript만큼 편리하게 조작할 수 있습니다. 이 기사에서는 XML을 처리하는 방법에 대해 더 많이 소개합니다. 오늘은 PHP에서 DOM 왜곡 코드를 해결하는 방법에 대해 자세히 설명하지 않겠습니다. 아래 솔루션을 살펴보겠습니다.

해결 방법은 다음과 같습니다

/**
 * 请求url页面信息
 * @param str $url
 * @return str mixed|boolean
 */
function curl_get($url) {
  $curl = curl_init();
  curl_setopt($curl, CURLOPT_URL, $url);
  curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
  //302跳转
  curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);
  curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:47.0) Gecko/20100101 Firefox/47.0');
  curl_setopt($curl, CURLOPT_REFERER, $url);
  $data = curl_exec($curl);
  $code = curl_getinfo($curl,CURLINFO_HTTP_CODE); //输出请求状态码
  curl_close($curl);
  if(200 == $code) {
    //解决乱码
    if (preg_match(&#39;#<meta[^>]*charset="?gb2312"[^>]*>#&#39;, $data)) {
      $data = iconv("gb2312","utf-8//IGNORE",$data);
      $data = preg_replace(&#39;#<meta[^>]*charset="?gb2312"[^>]*>#is&#39;, &#39;<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">&#39;, $data);
    }

    if (!preg_match(&#39;#<meta charset="utf-8"[^>]*>#is&#39;, $data)) {
      $data = str_replace(&#39;<head>&#39;, &#39;<head><meta http-equiv="Content-Type" content="text/html;charset=UTF-8">&#39;, $data);
    }

    if (preg_match(&#39;#<meta charset="utf-8"[^>]*>#is&#39;, $data)) {
      $data = preg_replace(&#39;#<meta charset="utf-8"[^>]*>#is&#39;, &#39;<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">&#39;, $data);
    }

    return $data;
  } else {
    return false;
  }

}

/**
 * 获取 DOMDocument 对象
 * @param str $url
 * @return boolean|DOM
 */
function getDom($url) {
  $html_content = curl_get($url);
  if(empty($html_content)) {
    //saveLog($url, &#39;请求失败&#39;);
    return false;
  }
  $dom = new DOMDocument(&#39;1.0&#39;, &#39;utf-8&#39;);
  libxml_use_internal_errors(true);
  $dom->loadHTML($html_content);
  return $dom;
}

$html_content = mb_convert_encoding($html_content, &#39;UTF-8&#39;, &#39;gb2312&#39;);

위 내용은 이 글의 전체 내용이며, 모든 분들의 공부에 도움이 되길 바랍니다.


관련 추천:

php아바타 업로드 미리보기 예시에 대한 자세한 설명

php아바타 업로드 미리보기 예시에 대한 자세한 설명

PHP 직렬화 및 역직렬화 기능 사진과 텍스트

위 내용은 DOM 왜곡 코드를 해결하는 PHP 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.