ホームページ  >  記事  >  バックエンド開発  >  PHP で中国語のテキスト文字列を文字化けせずにインターセプトする方法_PHP チュートリアル

PHP で中国語のテキスト文字列を文字化けせずにインターセプトする方法_PHP チュートリアル

WBOY
WBOYオリジナル
2016-07-13 10:48:541054ブラウズ

インターネット上で PHP で中国語をインターセプトする方法をたくさん見つけました。最も一般的な方法は、mb_substr 関数を使用してインターセプトすることです。この関数には php.ini の拡張機能のサポートが必要ですが、私には変更する権限がありません。別の方法を見つけなければなりません。

substrがインターセプトされました

substr() 関数は文字列の一部を返します。

コードは次のとおりです コードをコピー
$rest = substr("私は中国人です", -1); // "文字化けしたコード" を返します
echo $rest.'
';
$rest = substr("abcdef", -2); // "ef" を返します
echo $rest.'
';
$rest = substr("abcdef", -3, 1) // "d" を返します
; echo $rest.'
';
?>

その後、Baidu goole は mb_substr によって傍受される可能性があると言いました

コードは次のとおりです コードをコピー


echo mb_substr('私たちはみんな良い子だよ、へへ',0,9); ?>

操作メカニズムのヒント

致命的なエラー: 未定義の関数 mb_substr() の呼び出し...

その後、友人から、php_mbstring.dll は一般的なサーバーでは開かれないと言われ、php.ini で php_mbstring.dll を開く必要があることがわかりました。そのため、別の方法を見つける必要がありました

コードは次のとおりですコードをコピー関数 msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true) {これですべての問題が解決されます
if(function_exists("mb_substr"))

return mb_substr($str, $start, $length, $charset);
elseif(function_exists('iconv_substr')) {
return iconv_substr($str,$start,$length,$charset);
}
$re['utf-8'] = "/[x01-x7f]|[xc2-xdf][x80-xbf]|[xe0-xef][x80-xbf]{2}|[xf0-xff][x80] -xbf]{3}/";
$re['gb2312'] = "/[x01-x7f]|[xb0-xf7][xa0-xfe]/";
$ re ['gbk'] = "/[x01-x7f] | [x81-xfe] [x40-xfe]/";
$re['big5'] = "/[x01-x7f]|[x81-xfe]([x40-x7e]|xa1-xfe])/";
Preg_match_all($re[$charset], $str, $match);
$slice = join("",array_slice($match[0], $start, $length));
If($suffix) return $slice."…";
$slice を返す;
}


インターセプトは文字エンコーディングに基づいているようです。

http://www.bkjia.com/PHPjc/632743.html

www.bkjia.com本当http://www.bkjia.com/PHPjc/632743.html技術記事 PHP で中国語をインターセプトする方法については、インターネット上でたくさんの情報を見つけました。最も一般的なのは、mb_substr 関数を使用してインターセプトする方法ですが、この関数には php.ini の拡張機能のサポートが必要です。修正してください...
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。