Rumah  >  Artikel  >  pembangunan bahagian belakang  >  如何解决php网页抓取乱码问题

如何解决php网页抓取乱码问题

藏色散人
藏色散人asal
2020-09-04 10:14:062913semak imbas

php网页抓取乱码的解决办法:1、使用“mbconvertencoding”转换编码;2、设置添加“curl_setopt($ch, CURLOPT_ENCODING, 'gzip');”选项;3、在顶部增加header代码。

如何解决php网页抓取乱码问题

推荐:《PHP视频教程

php 抓取页面乱码

在抓取页面的时候出现类似�������这样乱码解决方法如下

1、转换编码

str=mbconvertencoding(str, “utf-8”, “GBK”);

2、数据经过gzip压缩

curl获取数据的时候设置添加下面的选项:

curl_setopt($ch, CURLOPT_ENCODING, 'gzip');

使用file_get_contents函数需要安装zlib库

$data = file_get_contents("compress.zlib://".$url);

3、获取数据后显示乱码

在顶部增加下面的代码

header("Content-type: text/html; charset=utf-8");

Atas ialah kandungan terperinci 如何解决php网页抓取乱码问题. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn