Heim  >  Artikel  >  php教程  >  CP936 in UTF-8 konvertiert

CP936 in UTF-8 konvertiert

WBOY
WBOYOriginal
2016-10-15 10:31:473912Durchsuche

Ich habe kürzlich ein Crawling-Skript geschrieben. Der größte Teil des erfassten Inhalts ist normal, aber ein kleiner Teil davon ist verstümmelt

Erkennen Sie die Zeichenkodierung und das Ergebnis ist CP936

mb_detect_encoding(<span style="color: #800080;">$str</span>, 'GBK, gb2312, GB18030, ISO-8859-1, ASCII, UTF-8', <span style="color: #0000ff;">true</span>)

Es wird versucht, diese Kodierung zu konvertieren, aber das Ergebnis ist immer noch verstümmelt

mb_convert_encoding($str, 'UTF-8', 'CP936');
氓聧掳氓潞娄盲赂聙70氓虏聛猫聙聛氓陇麓莽聦楼盲潞碌7氓虏聛氓楼鲁氓颅漏猫聙聦猫垄芦忙聧聲

Endlich festgestellt, dass dies transkodiert werden kann

iconv('utf-8', 'latin1', $str);
iconv('utf-8','latin1//IGNORE', $str);

 

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn