ホームページ >php教程 >php手册 >PHPを使用してgb2312とunicode間のエンコード変換を実装する

PHPを使用してgb2312とunicode間のエンコード変換を実装する

WBOY
WBOYオリジナル
2016-06-13 12:46:57920ブラウズ

gb2312 と unicode の間のコーディング変換
次の例は、gb2312 を「完全な」形式に変換するものです
php4.3.1 以降の iconv 関数は非常に使いやすく、自分で uft8 を書いて Unicode にするだけです。変換関数
ルックアップ テーブル (gb2312.txt) も使用できます

コードをコピー コードは次のとおりです:


$text = "スクリプト ホーム"
preg_match_all("/[x80-xff]?./",$text,$ar); as $v)
echo "&#".utf8_unicode(iconv("GB2312","UTF-8",$v)).";"
> >// utf8 -> unicode
function utf8_unicode($c) {
switch(strlen($c)) {
case 1:
return ord($c); 2:
$n = (ord($c[0]) & 0x3f) <<6;
$n = ord($c[1]) & 0x3f;
ケース 3:
$n = (ord($c[0]) & 0x1f)
$n = (ord($c[1]) & 0x3f) <
$n = ord($c[2]) & 0x3f;
$n を返す:
$n = ($c[0]) & 0x0f)
$n = (ord($c[1]) & 0x3f)
$n = (ord($c[2]))
$n = ord($c[3]) & 0x3f>
}
?>
以下の例では、PHP を使用して「完全な」エンコーディングを gb2312 に変換します。



コードをコピーします。

コードは次のとおりです。

< ?php

$str = "TTL 全天候オートフォーカス"
$str = preg_replace("|&#([0-9]{1,5}); |", "".u2utf82gb(\1 )."", $str);
$str = "$str="$str";";

eval($str); echo $ str; 関数 u2utf82gb($c ){ $str=""; if ($c <0x80) {

$str.=$c>} else if ( $c <0x800) {

$str.=chr(0xC0 | $c>>6);
$str.=chr(0x80 | $c & 0x3F); $c $str.=chr(0xE0 | $c>>12);
$str.=chr(0x80 | $c>>6 & 0x3F); $str.=chr(0x80 | $c & 0x3F);
} else if ($c $str.=chr(0xF0 | $c>>18); $str.=chr(0x80 | $c>>12 & 0x3F);
$str.=chr(0x80 | $c>>6 & 0x3F); $c & 0x3F);
}
return iconv('UTF-8', 'GB2312', $str)
}
?> または



コードをコピー

コードは次のとおりです。


function unescape($str) {
$str = rawurldecode( $str);
preg_match_all("/( ?:%u.{4})|.{4};|d ;|./U",$str,$r); >$ar = $r[0];
print_r($ar);
foreach($ar as $k=>$v) {
if(substr($v,0,2) == "%u")
$ar [$k] = iconv("UCS-2","GB2312",pack("H4",substr($v,-4))); (substr($v,0,3) == "")
$ar[$k] = iconv("UCS-2","GB2312",pack("H4",substr($v) ,3,-1)));
elseif(substr($v,0,2) == "") {

echo substr($v,2,-1)."
;";
$ar[$k] = iconv("UCS-2","GB2312",pack("n",substr($v,2,-1)));
}

} return join("",$ ar); } $str = "TTL 全天候型オートフォーカス" echo unescape($str);天気オートフォーカス


JavaScript を使用して変換



コードをコピー

コードは次のとおりです:


<スタイル>
BODY {
FONT-SIZE: 9pt;パディング右: 0px;パディング左: 0px;パディングボトム: 0px;パディングトップ: 0px;
}
input {
FONT-SIZE: 9pt;高さ: 13pt;
}

<スクリプト言語="JavaScript1.2">
/*
この次のコードは Windy_sk によって設計され、書かれています。
自由に使用できますが、すべての著作権はあなたが保持する必要があります。
*/
function Str2Unicode(str){
var arr = new Array();
for(var i=0;iarr[i]="" str.charCodeAt(i) ";";
}
return(arr.toString().replace(/,/g,""));
}
function Unicode2oStr(str){
var re=/[da-fA-F]{1,5};/ig;
var arr=str.match(re);
if(arr==null)return("");
for(var i=0;iarr[i]=String.fromCharCode(arr[i].replace(/[]/g,"") );
}
return(arr.toString().replace(/,/g,""))
}
function modi_str(){
if(document.all.text.method .checked){
if(document.all.text.decode.value!=""){
document.all.text.encode.value = Str2Unicode(document.all.text.decode.value);
}else{
document.all.text.decode.value = Unicode2oStr(document.all.text.encode.value);
}
}else{
if(document.all.text.encode.value!=""){
document.all.text.decode.value = Unicode2oStr(document.all.text .encode.value);
}else{
document.all.text.encode.value = Str2Unicode(document.all.text.decode.value);
}
}
}

Unicode
<フォーム名=テキスト>
文本の原型:




转换代码:




正向转换


复制代代码如下:



BODY {
FONT-SIZE: 9pt;パディング右: 0px;パディング左: 0px;パディングボトム: 0px;パディングトップ: 0px;
}
input {
FONT-SIZE: 9pt;高さ: 13pt;
}


関数 showUni(min,max){
show.document.open();
show.document.writeln("");
show.document.writeln(min " - " max "

");
var i=0;
for(i=min;ishow.document.write("" i ";");
}
show.document.close();
}









独自設定: - <入力名=最大>





下は一查表(gb2312),转换gb2312到utf8の例, 现在有iconv関数,这个已经没有太大意义了,

复制代 代码如下:


function gb2utf8($gb){
if(!trim($gb)) return $gb;
$filename="gb2312.txt";
$tmp=ファイル($ファイル名);
$codetable=array();
while(list($key,$value)=each($tmp))
$codetable[hexdec(substr($value,0,6))]=substr($value,7,6);
$utf8="";
while($gb) {
if (ord(substr($gb,0,1))>127) {
$this=substr($gb,0,2);
$gb=substr($gb,2,strlen($gb)-2);
$utf8.=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));
}else{
$this=substr($gb,0,1);
$gb=substr($gb,1,strlen($gb)-1);
$utf8.=u2utf8($this);
}
}
return $utf8;
}
関数 u2utf8($c){
$str="";
if ($c <0x80) {
$str.=$c;
} else if ($c <0x800) {
$str.=chr(0xC0 | $c>>6);
$str.=chr(0x80 | $c & 0x3F);
} else if ($c <0x10000) {
$str.=chr(0xE0 | $c>>12);
$str.=chr(0x80 | $c>>6 & 0x3F);
$str.=chr(0x80 | $c & 0x3F);
} else if ($c $str.=chr(0xF0 | $c>>18);
$str.=chr(0x80 | $c>>12 & 0x3F);
$str.=chr(0x80 | $c>>6 & 0x3F);
$str.=chr(0x80 | $c & 0x3F);
}
return $str;
}
?>

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。