ホームページ  >  記事  >  バックエンド開発  >  PHP で文字列を処理するためによく使用される関数 中国語と英語の混合植字_PHP チュートリアル

PHP で文字列を処理するためによく使用される関数 中国語と英語の混合植字_PHP チュートリアル

WBOY
WBOYオリジナル
2016-07-13 17:33:251251ブラウズ


/*
中国人のデータを処理するとき、いくつかの状況に対処しなければならないことがよくあります。これらのケースのために私が作成した、実際に使用されている関数をいくつか紹介します

*/

# 特定の立場が中国人であるかどうかを判断します。文字 左半分または右半分、または中国語ではありません
# 戻り値 -1 左 0 漢字ではありません 1 右
# 使い方
/*
$a = これは中国語です;
print is_chinese($a, 1); // 0
print is_chinese($a,8); // -1
print is_chinese($a,9); // 1
*/
function is_chinese(&$str, $location) {
$ch = true;
$ i = $location;
while(ord($str[$i])>0xa0 && $i >= 0) {
$ch = !$ch;
$i --;
}

if( $ i != $location) {
$f_str = $ch ? 1: -1;
}
else {
$f_str = false;
}

return $f_str;
}

#中国語文字列反転関数
#中国語の文字列をstrrevで反転すると文字化けが発生します
/*
print cstrrev(これは中国語です) // si siht
*/

function cstrrev(&$str) {
$long = strlen($str);
for($f_str=, $chinese=false, $i=$long-1; $i>=0; $i--) {
if(ord($str[$i ]) > 0xa0) {
$chinese = ! $chinese;
if($chinese == false) {
$f_str .= $str[$i].$str[$i+1];
}
}
else {
$f_str .= $str[$i];
}
}
return $f_str;
}
/* 中国語文字列インターセプト関数
一部の中国語文字列インターセプト関数には、一部の自動行内など、いくつかの問題が発生することがよくあります。ラッピングプログラム、
$a = "1 in 2";
2 つのインターセプト後、
csubstr($str, $a,0,2);
csubstr($str, $a, 2,2)
右バイトを取るその位置が「真ん中」を指している場合、結果は次のようになります
1, 2
この関数を使用すると正しい結果が得られます
1 medium, 2
*/
# start 開始位置、0 から開始します
# long = 0,文字列の先頭から末尾までフェッチします
# ltor = trueの場合は左から右に文字をフェッチし、falseの場合は右から左に文字をフェッチします
# $cn_len 中国語文字は、バイト数または単語数でフェッチされます。 word count で取得した後、漢字 1 文字を 1 バイトとして計算します

function csubstr(&$str, $start=0, $long=0, $ltor=true, $cn_len=2) {
if($long = = 0) $long = strlen($str);
if($ltor == false) $str = cstrrev($str);

if($cn_len == 1) {

for($i=0, $fs=0; $i $i += (ord($str[$fs]) for($i=0, $fe=) $fs; $i<$fe++)
$i += (ord($str[$fe]) <= 0xa0) 1 : 0.5;
$fe - $fs;
}
else {

$fs = (is_chinese($str, $start) == 1) ? $start - 1 : $start;
$fe = $long + $start - 1;
$end = ( is_chinese($ str, $fe) == -1 ) ? $fe -1 : $fe;
$long = $end - $fs + 1;
}

$f_str = substr($str, $fs, $long);
if($ltor == false) $f_str = cstrrev($f_str);

return $f_str;
}

# 左の文字列を取得
Byte
function cleft(&$str, $long, $cn_len=2 ) {
$f_str = csubstr($str, 0, $long, true, $cn_len);
return $f_str;
}

# 正しい文字列を取得
function cright(&$str, $long, $cn_len=2 ) {
$f_str = cstrrev($str);
$f_str = csubstr($f_str, 0, $long, true, $cn_len);
$f_str = cstrrev($f_str);
return $f_str;
}
# 漢字を含む記事を改行で書式設定します
# 改行によるさまざまな問題はもう発生しません! ! !
# 注: 記事の各行は n (chr(13)) で区切る必要があります
# $width 1 行の文字数
# $br 各行の終了文字として使用する文字は何ですか

function ctext_wrap( &$text, $ width=60, $br="
") {

www.bkjia.comtru​​ehttp://www.bkjia.com/PHPjc/508611.html技術記事 /* 中国語のデータを処理するとき、いくつかの状況に対処する必要があることがよくあります。これらの状況のた​​めに私が作成した、実際に使用されている関数をいくつか示します。*/ # 特定の位置が漢字であるかどうかを判断します...
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。