ホームページ >バックエンド開発 >PHPの問題 >PHP中国語が文字化けをインターセプトした場合の対処方法

PHP中国語が文字化けをインターセプトした場合の対処方法

coldplay.xixi
coldplay.xixiオリジナル
2020-11-13 11:56:372150ブラウズ

中国語の文字化けをインターセプトする解決策: まず、ASCII エンコーディングと中国語エンコーディングの一貫性のないバイナリ範囲を使用してそれらを区別し、次に [substr()] 関数を使用して文字列をインターセプトします。

PHP中国語が文字化けをインターセプトした場合の対処方法

php 中国語文字化けのインターセプトの解決策:

実装原理は比較的単純で、主に ASCII エンコーディングを使用します。中国語エンコーディングのバイナリ範囲は、それらを区別するための中国語エンコーディングのバイナリ範囲と一致しないため、文字列をインターセプトするために substr() 関数が使用されます。

私が書いたコードは以下に示されています。注: ここでは utf-8 エンコーディングのみに焦点を当てています。他のエンコーディングの場合、リーダーは他のエンコーディングをサポートするように関数を手動で変更できます。

<?php
header(&#39;content-type:text/html;charset=utf-8;&#39;);
$str = &#39;利要a-符e:r ttnx节小-子s区。vh;peh。例t来个oe体字n代gb节看t通c eu是的soS至什tna过码 t;Ie看C实e/,字le A来具8y么a)n=于ndg是r于 0tmt现码 e0ssf8单下s(uo别e的以ieh过aatx和t接要u几这看 nsw Ihrr用字 mgtts上就eg cAei的nwo码e跳h,t编&#39;;
/*
*在某篇文章中截取一段字符串,多余的用省略号...表示,并且防止中文乱码
*$param1 string要截取的字符串 $str  注意:这里是utf-8编码
*$param2 int截取字符串的长度 $len  
*返回值 成功返回所要截取的字符串,失败为空
*/
function str($str=&#39;&#39;,$len=0){
    //检查参数
    if(!is_string($str) || !is_int($len)){
        return &#39;&#39;;
    }
    $length = strlen($str);
    if($length <= 0 ){
        return &#39;&#39;;
    }
    if($len>=$length){
        return $str;
    }
    //初始化,统计字符串的个数,
    $count = 0;
    for($i=0;$i<$length;$i++){
        //达到个数跳出循环,$i即为要截取的长度
        if($count == $len){
            break;
        }
        $count++;
        //ord函数是获取字符串的ASCII编码,大于等于十六进制0x80的字符串即为中文字符串
        if(ord($str{$i}) >= 0x80){
            $i +=2;//中文编码的字符串的长度再加2
        }
    }
    //如果要截取的个数超过了字符串的总个数,那么我们返回全部字符串,不带省略号
    if($len > $count){
        return $str;
    }else{
        return substr($str,0,$i).&#39;...&#39;;
    }
}

上記のコードの実装では、0x80 未満の半角文字の ASCII コードを使用します。何バイトスキップするかについては、特定のエンコーディングによって異なります。

関連する無料学習の推奨事項: php プログラミング (ビデオ)

以上がPHP中国語が文字化けをインターセプトした場合の対処方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。