Heim  >  Artikel  >  Backend-Entwicklung  >  So lösen Sie verstümmelte Zeichen bei der PHP-Codierungskonvertierung

So lösen Sie verstümmelte Zeichen bei der PHP-Codierungskonvertierung

小云云
小云云Original
2018-03-28 15:29:374341Durchsuche

In diesem Artikel erfahren Sie hauptsächlich, wie Sie durch die Kombination von Text und Code verstümmelten PHP-Kodierungskonvertierungscode lösen können. Ich hoffe, er kann allen helfen.

iconv Ausführliche Erklärung:
iconv – Die Zeichenfolge wird entsprechend den erforderlichen Zeichen codiert, um zu konvertieren
iconv hat einen Fehler und kann einige seltene Zeichen nicht konvertieren. Wenn Sie den zweiten Parameter konfigurieren, können Sie die Standardfehler natürlich ein wenig ausgleichen, sodass die Konvertierung nicht möglich ist abschneiden. Die Verwendung ist wie folgt:
iconv("UTF-8″, "GB2312//IGNORE",$data);
Wenn die Konvertierung seltener Zeichen fehlschlägt, wird der Fehler ignoriert und Konvertieren Sie weiterhin den folgenden Inhalt.

iconvstring iconv ( string $in_charset , string $out_charset , string $str )

第一个参数:内容原的编码

第二个参数:目标编码

第三个参数:要转的字符串

函数返回字符串<?php$instr = ‘测试’;// GBK转UTF-8$outstr = iconv(‘GBK’,&#39;UTF-8′,$instr);

?>

Rückgabewert
Gibt die konvertierte Zeichenfolge zurück oder FALSE bei einem Fehler.

Detaillierte Erklärung von mb_convert_encoding:
Um die Erfolgsquote der Konvertierung sicherzustellen, können wir eine weitere Konvertierungsfunktion mb_convert_encoding, die Effizienz dieser Funktion ist nicht sehr hoch. Darüber hinaus kann diese Funktion auch den dritten Parameter weglassen und die Inhaltscodierung automatisch identifizieren. Dies beeinträchtigt jedoch die Effizienz Sie müssen auch darauf achten, dass die Reihenfolge der Parameter mb_convert_encoding und iconv unterschiedlich ist. Achten Sie daher unbedingt darauf.

Anbei finden Sie die einfache Verwendung von zwei Funktionen:

mb_convert_encoding
string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] )
第一个参数:要处理的字符串
第二个参数:目标编码
第三个参数:内容原编码,它可以是一个 array 也可以是逗号分隔的枚举列表<?php$instr = &#39;测试&#39;;
// GBK转UTF-8$outstr = mb_convert_encoding($instr,&#39;UTF-8&#39;,&#39;GBK&#39;,);
$str = mb_convert_encoding($instr, "UCS-2LE", "JIS, eucjp-win, sjis-win");?>

Persönlicher Vorschlag zur Transkodierung Es ist sicherer, mb_convert_encoding zu verwenden, wenn ein Problem auftritt.

mb_convert_variables

mb_convert_variables —

Konvertiert die Zeichenkodierung einer oder mehrerer Variablen

mb_convert_variables ( $to_encoding , $from_encoding , &$vars [, mixed &$... ] )
Konvertieren Sie die Kodierung der Variablenvariablen von from_encoding in die Kodierung to_encoding.

mb_convert_variables() 会拼接变量数组或对象中的字符串来检测编码,因为短字符串的检测往往会失败。因此,不能在一个数组或对象中混合使用编码。
to_encoding  将 string 转换成这个编码。

from_encoding 可以指定为一个 array 或者逗号分隔的 string,它将尝试根据 from-coding 来检测编码。 当省略了 from_encoding,将使用 detect_order。
vars 是要转换的变量的引用。 参数可以接受 String、Array 和 Object 的类型。 mb_convert_variables() 假设所有的参数都具有同样的编码。
额外的 vars。
返回值 :
成功时返回转换前的字符编码,失败时返回 FALSE。
实例:<?php/* 转换变量 $post1、$post2 编码为内部(internal)编码 
*/$interenc = mb_internal_encoding();$inputenc = mb_convert_variables($interenc,
 "ASCII,UTF-8,SJIS-win", $post1, $post2);?>

mb_internal_encoding mb_internal_encoding —
Interne Zeichenkodierung festlegen/erhalten

mixed mb_internal_encoding ([ string $encoding = mb_internal_encoding() ] )
参数 :
encoding 字符编码名称使用于 HTTP 输入字符编码转换、HTTP 输出字符编码转换、mbstring 模块系列函数字符编码转换的默认编码。 
返回值 :
如果设置了 encoding,则成功时返回 TRUE, 或者在失败时返回 FALSE。 In this case, the character encoding for multibyte regex is NOT changed. 如果省略了 encoding,则返回当前的字符编码名称。
<?php/* 设置内部字符编码为 UTF-8 */mb_internal_encoding("UTF-8");/* 显示当前的内部字符编码*/echo mb_internal_encoding();?>

Detaillierte Erklärung von mb_detect_encoding:

mb_detect_encoding —

Zeichenkodierung erkennen

string mb_detect_encoding ( string $str [, mixed $encoding_list = mb_detect_order() [, bool $strict = false ]] )

  • 1

检测字符串 str 的编码。

参数 
str    待检查的字符串。
encoding_list   是一个字符编码列表。 编码顺序可以由数组或者逗号分隔的列表字符串指定。
如果省略了 encoding_list 将会使用 detect_order。strict    strict 指定了是否严格地检测编码。 默认是 FALSE。
返回值
检测到的字符编码,或者无法检测指定字符串的编码时返回 FALSE。

字符串编码未知的情况下对字符串进行编码: 
1、无论字符串编码是什么,均转换为gbk

function getSafeStr($str){
    $s1 = iconv(&#39;utf-8&#39;,&#39;gbk//IGNORE&#39;,$str);    $s0 = iconv(&#39;gbk&#39;,&#39;utf-8//IGNORE&#39;,$s1);    if($s0 == $str){        return $s1;
    }else{        return $str;
    }
}

2、无论字符串编码是什么,均转换为utf-8

function getSafeStr($str){
    $s1 = iconv(&#39;gbk&#39;,&#39;utf-8//IGNORE&#39;,$str);    $s0 = iconv(&#39;utf-8&#39;,&#39;gbk//IGNORE&#39;,$s1);    if($s0 == $str){        return $s1;
    }else{        return $str;
    }
}

获取字符串编码方法:

function getcode($str){
    $s1 = iconv(&#39;utf-8&#39;,&#39;gbk//IGNORE&#39;,$str);    $s0 = iconv(&#39;gbk&#39;,&#39;utf-8//IGNORE&#39;,$s1);    if($s0 == $str){        return &#39;utf-8&#39;;
    }else{        return &#39;gbk&#39;;
    }
}

Das obige ist der detaillierte Inhalt vonSo lösen Sie verstümmelte Zeichen bei der PHP-Codierungskonvertierung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn