关于curl抓取回来的网页中中文乱码的有关问题-tutorial php-php.cn

Rumah

pembangunan bahagian belakang

tutorial php

关于curl抓取回来的网页中中文乱码的有关问题

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 13, 2016 am 10:48 AM

codeencodingstr

关于curl抓取回来的网页中中文乱码的问题！
目前使用这个函数进行转码：
function safeEncoding($str){
$code=mb_detect_encoding($str,array('ASCII','GB2312','GBK','UTF-8'));//检测字符串编码
if($code=="CP936"){
$result=$str;
}
else{
//$result=mb_convert_encoding($str,'UTF-8',$code);//将编码$code转换为utf-8编码
$result=iconv($code,"UTF-8",$str);
}
return $result;
}
可是还是有问题，遇到有些明明charset写着gb2312的抓回来还是乱码，请教高手，curl到底该怎么全面的进行转码呢？就是把gbk,gb2312等网页常用格式转成utf8的。

------解决方案--------------------
把你的文件编码转换下试试！
------解决方案--------------------
EUC-CN是GB 2312最常用的表示方法。浏览器编码表上的“GB2312”，通常都是指“EUC-CN”表示法。
这不是关键！
你需要的是把gbk,gb2312等网页常用格式转成utf8的
而你的代码正好没有这样做

if(! mb_check_encoding($str, 'utf-8')) {
$str = mb_convert_encoding($str,'UTF-8','gbk');
}

Kenyataan

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel Berkaitan

在Visual Studio Code中编辑Unity项目，您现在可以开始了Aug 08, 2023 am 10:21 AM

Microsoft发布了VisualStudioCode的Unity扩展预览版。这个新的Unity扩展将允许您编写和调试Unity游戏。这个新的Unity扩展带来了VisualStudio和VisualStudioToolsforUnity上已经提供的一些流行功能，使VisualStudioCode中的C#更好地进行Unity开发。目前，适用于VSCode的Unity扩展提供以下内容：一个Unity调试器，用于调试您的Unity编辑器和Unity播放器。特定于Unity的C#分析器和重构。Uni

Java中的UnsupportedEncodingException异常该如何处理？Jun 25, 2023 am 08:02 AM

Java中的UnsupportedEncodingException异常该如何处理？在Java编程中，可能会遇到UnsupportedEncodingException异常。这个异常通常是由于编码转换不正确或编码不支持造成的。在这篇文章中，我们将介绍UnsupportedEncodingException异常的原因和如何处理它。什么是UnsupportedE

Python内建类型str源码分析May 09, 2023 pm 02:16 PM

1Unicode计算机存储的基本单位是字节，由8个比特位组成。由于英文只由26个字母加若干符号组成，因此英文字符可以直接用字节来保存。但是其他语言（例如中日韩等），由于字符众多，不得不使用多个字节来进行编码。随着计算机技术的传播，非拉丁文字符编码技术不断发展，但是仍然存在两个比较大的局限性：不支持多语言：一种语言的编码方案不能用于另外一种语言没有统一标准：例如中文就有GBK、GB2312、GB18030等多种编码标准由于编码方式不统一，开发人员就需要在不同编码之间来回转换，不可避免地会出现很多错

Python中__str__和__repr__有什么异同点Apr 29, 2023 pm 07:58 PM

__str__和__repr__有什么异同?字符串的表示形式我们都知道，Python的内置函数repr()能够把对象用字符串的形式表达出来，方便我们辨认。这就是“字符串表示形式”。repr()就是通过__repr__这个特殊方法来得到一个对象的字符串表示形式的。如果没有实现__repr__，当我们在控制台里打印一个向量的实例时，得到的字符串可能会是。>>>classExample:pass>>>print(str(Example()))>>>

Java中的UnsupportedEncodingException异常的解决方法Jun 25, 2023 am 08:48 AM

Java中可能会出现UnsupportedEncodingException异常，主要是因为编码不被支持导致。在处理文本数据时，经常需要进行编码转换，也就是把一种编码格式的内容转换成另一种编码格式的内容。而如果进行编码转换时使用的编码类型不被支持，就会抛出UnsupportedEncodingException异常。本文将介绍该异常的解决方法。一、

使用encoding/csv包提供的函数进行CSV文件的读写操作Jul 24, 2023 pm 01:13 PM

使用encoding/csv包提供的函数进行CSV文件的读写操作CSV（Comma-SeparatedValues）是一种常用的数据存储格式，可以简单地将数据以逗号分隔的形式保存为文本文件。在Python中，可以使用标准库中的encoding/csv包来方便地进行CSV文件的读写操作。首先，我们需要导入encoding/csv包：importcsv接下来

Redis类型type与编码encoding原理及使用方法是什么May 29, 2023 pm 04:21 PM

摘要Redis是一款开源的高性能key-value数据库，广泛应用于各种场景。在Redis中，数据类型（type）和编码（encoding）是非常重要的概念。本篇博客将详细介绍Redis支持的数据类型以及相应的编码方式和底层实现原理。要查看Redis某个key的内部编码，可以使用Redis命令OBJECTENCODINGkey。其中，key是你想要查询的键名。例如，如果你想要查询名为mykey的键的内部编码，可以执行以下命令：127.0.0.1:6379>objectencodin

揭秘Go语言中str的奥秘Mar 29, 2024 am 11:27 AM

Go语言是一种快速、简洁、高效的开源编程语言，越来越受到程序员的喜爱和欢迎。字符串（string）是程序中经常使用的数据类型之一，在Go语言中也有着独特的处理方式。本文将带领读者揭秘Go语言中字符串（str）的奥秘，并通过具体的代码示例来解析其用法和特点。字符串的定义和初始化在Go语言中，字符串是以双引号""包裹的字符序列，例如：str

See all articles