-
-
//比較表の使い方 - $filename = "gb2utf8.txt";
- $fp = fopen($filename,"r");
- while(! feof ($fp)) {
- list($gb,$utf8) = fgetcsv($fp,10);
- $charset[$gb] = $utf8;
- }
- fclose($fp);
- //上記の読み取り後で使用するためにテーブルを配列に検索します
/**gb2312 から utf-8**/
- function gb2utf8($text, &$charset) {
- //テキスト内のコンポーネントを抽出します。漢字は 1 つです要素、連続 中国語以外の文字は要素です
- preg_match_all("/(?:[x80-xff].)|[x01-x7f]+/",$text,$tmp);
- $tmp = $tmp[ 0];
- / /中国語の文字を区切る
- $ar = array_intersect($tmp, array_keys($charset));
- //中国語の文字エンコーディングを置き換える
- foreach($ar as $k=>$v)
- $tmp[ $k] = $charset [$v];
- //エスケープされた文字列を返します
- return join('',$tmp);
- }
/**utf-8 から gb2312**/
- function utf82gb($ text, &$charset) {
- $p = "/[xf0-xf7][x80-xbf]{3}|[xe0-xef][x80-xbf]{2}|[xc2-xdf] [x80-xbf ]|[x01-x7f]+/";
- preg_match_all($p,$text,$r);
- $utf8 = array_flip($charset);
- foreach($r[0] as $k= >$v )
- if(isset($utf8[$v]))
- $r[0][$k] = $utf8[$v];
- return join('',$r[0]);
- }< /p>
//Test
- $s = gb2utf8('これは比較表のテストです', $charset);
- echo utf82gb($s, $charset);
- ?> ;
-
コードをコピー
|