>  기사  >  php教程  >  CP936이 UTF-8로 변환됨

CP936이 UTF-8로 변환됨

WBOY
WBOY원래의
2016-10-15 10:31:473932검색

최근 크롤링 스크립트를 작성했는데, 캡쳐된 내용은 대부분 정상인데, 일부 내용이 깨졌습니다

문자 인코딩을 감지하면 결과는 CP936입니다

mb_detect_encoding(<span style="color: #800080;">$str</span>, 'GBK, gb2312, GB18030, ISO-8859-1, ASCII, UTF-8', <span style="color: #0000ff;">true</span>)

이 인코딩을 변환하려고 시도했지만 결과가 여전히 깨졌습니다.

mb_convert_encoding($str, 'UTF-8', 'CP936');
氓聧掳氓潞娄盲赂聙70氓虏聛猫聙聛氓陇麓莽聦楼盲潞碌7氓虏聛氓楼鲁氓颅漏猫聙聦猫垄芦忙聧聲

드디어 트랜스코딩이 가능하다는 사실을 발견했습니다

iconv('utf-8', 'latin1', $str);
iconv('utf-8','latin1//IGNORE', $str);

 

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.