>백엔드 개발 >PHP 튜토리얼 >PHP 인코딩 변환 문자가 깨졌을 때 해결하는 방법

PHP 인코딩 변환 문자가 깨졌을 때 해결하는 방법

小云云
小云云원래의
2018-03-28 15:29:374466검색

이 기사는 주로 텍스트와 코드를 결합하여 PHP 인코딩 변환에서 잘못된 코드를 해결하는 방법을 공유합니다. 모든 사람에게 도움이 되기를 바랍니다.

iconv에 대한 자세한 설명:
iconv — 문자열은 필수 문자에 따라 인코딩되고 변환됩니다. iconv에는 버그가 있으며 일부 희귀 문자가 나타나면 변환할 수 없습니다. 기본 단점을 조금 보완하기 위해 변환이 불가능해지는 것을 방지하기 위해 잘림을 사용합니다. 사용법은 다음과 같습니다
iconv("UTF-8″,"GB2312//IGNORE",$data);
여기서 즉, 희귀 문자 변환에 실패하면 해당 오류를 무시하고 아래 내용을 계속 변환합니다.

iconvstring iconv ( string $in_charset , string $out_charset , string $str )

第一个参数:内容原的编码

第二个参数:目标编码

第三个参数:要转的字符串

函数返回字符串<?php$instr = ‘测试’;// GBK转UTF-8$outstr = iconv(‘GBK’,&#39;UTF-8′,$instr);

?>

반환 값

변환된 문자열을 반환하거나 실패 시 FALSE를 반환합니다.

mb_convert_encoding 자세한 설명: 전환 성공률을 보장하기 위해 다른
conversion함수 mb_convert_encoding을 사용할 수도 있습니다. 또한 이 함수는 세 번째 매개변수를 생략할 수도 있습니다. 인코딩을 수행하지만, 그래도 주의가 필요한 경우에는 mb_convert_encoding과 iconv 매개변수의 순서가 다르기 때문에 주의해야 합니다.

사용할 수 있는 간단한 두 가지 기능이 첨부되어 있습니다.

mb_convert_encoding
string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] )
第一个参数:要处理的字符串
第二个参数:目标编码
第三个参数:内容原编码,它可以是一个 array 也可以是逗号分隔的枚举列表<?php$instr = &#39;测试&#39;;
// GBK转UTF-8$outstr = mb_convert_encoding($instr,&#39;UTF-8&#39;,&#39;GBK&#39;,);
$str = mb_convert_encoding($instr, "UCS-2LE", "JIS, eucjp-win, sjis-win");?>


개인적으로는 트랜스코딩 문제가 발생할 때 mb_convert_encoding을 사용하는 것이 더 안전합니다.

mb_convert_variables

mb_convert_variables —

하나 이상의 변수의 문자 인코딩을 변환합니다.

mb_convert_variables ( $to_encoding , $from_encoding , &$vars [, mixed &$... ] )

변수 var의 인코딩을 from_encoding에서 to_encoding 인코딩으로 변환합니다.

mb_convert_variables() 会拼接变量数组或对象中的字符串来检测编码,因为短字符串的检测往往会失败。因此,不能在一个数组或对象中混合使用编码。
to_encoding  将 string 转换成这个编码。

from_encoding 可以指定为一个 array 或者逗号分隔的 string,它将尝试根据 from-coding 来检测编码。 当省略了 from_encoding,将使用 detect_order。
vars 是要转换的变量的引用。 参数可以接受 String、Array 和 Object 的类型。 mb_convert_variables() 假设所有的参数都具有同样的编码。
额外的 vars。
返回值 :
成功时返回转换前的字符编码,失败时返回 FALSE。
实例:<?php/* 转换变量 $post1、$post2 编码为内部(internal)编码 
*/$interenc = mb_internal_encoding();$inputenc = mb_convert_variables($interenc,
 "ASCII,UTF-8,SJIS-win", $post1, $post2);?>

mb_internal_encoding mb_internal_encoding —
내부 문자 인코딩 설정/가져오기

mixed mb_internal_encoding ([ string $encoding = mb_internal_encoding() ] )
参数 :
encoding 字符编码名称使用于 HTTP 输入字符编码转换、HTTP 输出字符编码转换、mbstring 模块系列函数字符编码转换的默认编码。 
返回值 :
如果设置了 encoding,则成功时返回 TRUE, 或者在失败时返回 FALSE。 In this case, the character encoding for multibyte regex is NOT changed. 如果省略了 encoding,则返回当前的字符编码名称。
<?php/* 设置内部字符编码为 UTF-8 */mb_internal_encoding("UTF-8");/* 显示当前的内部字符编码*/echo mb_internal_encoding();?>

mb_Detect_encoding 자세한 설명:

mb _Detect_encoding —

문자 인코딩 감지

string mb_detect_encoding ( string $str [, mixed $encoding_list = mb_detect_order() [, bool $strict = false ]] )

  • 1

检测字符串 str 的编码。

参数 
str    待检查的字符串。
encoding_list   是一个字符编码列表。 编码顺序可以由数组或者逗号分隔的列表字符串指定。
如果省略了 encoding_list 将会使用 detect_order。strict    strict 指定了是否严格地检测编码。 默认是 FALSE。
返回值
检测到的字符编码,或者无法检测指定字符串的编码时返回 FALSE。

字符串编码未知的情况下对字符串进行编码: 
1、无论字符串编码是什么,均转换为gbk

function getSafeStr($str){
    $s1 = iconv(&#39;utf-8&#39;,&#39;gbk//IGNORE&#39;,$str);    $s0 = iconv(&#39;gbk&#39;,&#39;utf-8//IGNORE&#39;,$s1);    if($s0 == $str){        return $s1;
    }else{        return $str;
    }
}

2、无论字符串编码是什么,均转换为utf-8

function getSafeStr($str){
    $s1 = iconv(&#39;gbk&#39;,&#39;utf-8//IGNORE&#39;,$str);    $s0 = iconv(&#39;utf-8&#39;,&#39;gbk//IGNORE&#39;,$s1);    if($s0 == $str){        return $s1;
    }else{        return $str;
    }
}

获取字符串编码方法:

function getcode($str){
    $s1 = iconv(&#39;utf-8&#39;,&#39;gbk//IGNORE&#39;,$str);    $s0 = iconv(&#39;gbk&#39;,&#39;utf-8//IGNORE&#39;,$s1);    if($s0 == $str){        return &#39;utf-8&#39;;
    }else{        return &#39;gbk&#39;;
    }
}

위 내용은 PHP 인코딩 변환 문자가 깨졌을 때 해결하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.