ホームページ  >  記事  >  バックエンド開発  >  PHPエンコード変換の文字化けを解決する方法

PHPエンコード変換の文字化けを解決する方法

小云云
小云云オリジナル
2018-03-28 15:29:374344ブラウズ

この記事では主に、PHP のエンコード変換で文字化けしたコードを解決する方法を説明します。皆さんのお役に立てれば幸いです。

iconv の詳細な説明:
iconv — 文字列は必要な文字に従ってエンコードされ、変換されます iconv にはバグがあり、2 番目のパラメーターを設定するときに、当然、変換できません。デフォルトの欠点を少し補うために、変換できないことを避けるために切り捨てが使用されます。使用方法は次のとおりです
iconv("UTF-8″,"GB2312//IGNORE",$data);
ちなみに、稀な文字の変換に失敗した場合は、その失敗を無視して、以下の内容の変換を続行します。

iconvstring iconv ( string $in_charset , string $out_charset , string $str )

第一个参数:内容原的编码

第二个参数:目标编码

第三个参数:要转的字符串

函数返回字符串<?php$instr = ‘测试’;// GBK转UTF-8$outstr = iconv(‘GBK’,&#39;UTF-8′,$instr);

?>

戻り値

変換された文字列を返すか、失敗した場合は FALSE を返します。

mb_convert_encoding の詳細な説明: 変換の成功率を保証するために、別の
conversion 関数 mb_convert_encoding を使用することもできます。また、この関数は 3 番目のパラメーターを省略することもできます。エンコーディングを自動的に識別しますが、効率に影響するため、使用しないことをお勧めします。それでも注意が必要な場合は、mb_convert_encoding と iconv パラメーターの順序が異なるため、注意が必要です。

2 つの関数の簡単な使用法を以下に示します:

mb_convert_encoding
string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] )
第一个参数:要处理的字符串
第二个参数:目标编码
第三个参数:内容原编码,它可以是一个 array 也可以是逗号分隔的枚举列表<?php$instr = &#39;测试&#39;;
// GBK转UTF-8$outstr = mb_convert_encoding($instr,&#39;UTF-8&#39;,&#39;GBK&#39;,);
$str = mb_convert_encoding($instr, "UCS-2LE", "JIS, eucjp-win, sjis-win");?>


個人的には、トランスコーディングの問題が発生した場合は mb_convert_encoding を使用する方が安全です。

mb_convert_variables

mb_convert_variables —

1つ以上の変数の文字エンコーディングを変換します

mb_convert_variables ( $to_encoding , $from_encoding , &$vars [, mixed &$... ] )

変数varsのエンコーディングをfrom_encodingからencoding to_encodingに変換します。

mb_convert_variables() 会拼接变量数组或对象中的字符串来检测编码,因为短字符串的检测往往会失败。因此,不能在一个数组或对象中混合使用编码。
to_encoding  将 string 转换成这个编码。

from_encoding 可以指定为一个 array 或者逗号分隔的 string,它将尝试根据 from-coding 来检测编码。 当省略了 from_encoding,将使用 detect_order。
vars 是要转换的变量的引用。 参数可以接受 String、Array 和 Object 的类型。 mb_convert_variables() 假设所有的参数都具有同样的编码。
额外的 vars。
返回值 :
成功时返回转换前的字符编码,失败时返回 FALSE。
实例:<?php/* 转换变量 $post1、$post2 编码为内部(internal)编码 
*/$interenc = mb_internal_encoding();$inputenc = mb_convert_variables($interenc,
 "ASCII,UTF-8,SJIS-win", $post1, $post2);?>

mb_internal_encoding mb_internal_encoding —
内部文字エンコーディングの設定/取得

mixed mb_internal_encoding ([ string $encoding = mb_internal_encoding() ] )
参数 :
encoding 字符编码名称使用于 HTTP 输入字符编码转换、HTTP 输出字符编码转换、mbstring 模块系列函数字符编码转换的默认编码。 
返回值 :
如果设置了 encoding,则成功时返回 TRUE, 或者在失败时返回 FALSE。 In this case, the character encoding for multibyte regex is NOT changed. 如果省略了 encoding,则返回当前的字符编码名称。
<?php/* 设置内部字符编码为 UTF-8 */mb_internal_encoding("UTF-8");/* 显示当前的内部字符编码*/echo mb_internal_encoding();?>

mb_detect_encoding 詳細な説明:

mb _detect_encoding —

文字エンコーディングを検出

string mb_detect_encoding ( string $str [, mixed $encoding_list = mb_detect_order() [, bool $strict = false ]] )

  • 1

检测字符串 str 的编码。

参数 
str    待检查的字符串。
encoding_list   是一个字符编码列表。 编码顺序可以由数组或者逗号分隔的列表字符串指定。
如果省略了 encoding_list 将会使用 detect_order。strict    strict 指定了是否严格地检测编码。 默认是 FALSE。
返回值
检测到的字符编码,或者无法检测指定字符串的编码时返回 FALSE。

字符串编码未知的情况下对字符串进行编码: 
1、无论字符串编码是什么,均转换为gbk

function getSafeStr($str){
    $s1 = iconv(&#39;utf-8&#39;,&#39;gbk//IGNORE&#39;,$str);    $s0 = iconv(&#39;gbk&#39;,&#39;utf-8//IGNORE&#39;,$s1);    if($s0 == $str){        return $s1;
    }else{        return $str;
    }
}

2、无论字符串编码是什么,均转换为utf-8

function getSafeStr($str){
    $s1 = iconv(&#39;gbk&#39;,&#39;utf-8//IGNORE&#39;,$str);    $s0 = iconv(&#39;utf-8&#39;,&#39;gbk//IGNORE&#39;,$s1);    if($s0 == $str){        return $s1;
    }else{        return $str;
    }
}

获取字符串编码方法:

function getcode($str){
    $s1 = iconv(&#39;utf-8&#39;,&#39;gbk//IGNORE&#39;,$str);    $s0 = iconv(&#39;gbk&#39;,&#39;utf-8//IGNORE&#39;,$s1);    if($s0 == $str){        return &#39;utf-8&#39;;
    }else{        return &#39;gbk&#39;;
    }
}

以上がPHPエンコード変換の文字化けを解決する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。