インターネットで検索すると、「PHP to Pinyin」はあちこちにありますが、コードは GB2312 のみをサポートしています。
「骞」、「霜」、「慧」という単語もサポートできません。
中国語の名前をピンインに変換するには、そのコードでは十分とは言えません。
正しい GBK からピンイン コードが発表されました。オリジナルの作者: Ma Minglian (!hightman) に感謝します。ホームページ: http://php.twomice.net。
元のデモは 1 単語のクエリのみをサポートし、中国語と英語の両方の文字列をサポートするように変更しました。元のテキストは英語で返され、中国語の文字は声調付きのピンインに変換されます。
現時点では複数の発音文字はサポートされていません。たとえば、「Zeng」は ceng2 に変換されますが、zeng1 はありません。
(インターネット上にyii中国語のPHPプロジェクトがありますが、残念ながらピンイン変換もGB2312です)
使用方法:
$str = '漢字 abc123-=+';
$py = pinyin::instance(); //必要に応じて、単一インスタンスも機能します。
echo $py->get($str);
ページの最後にあるコード全体をダウンロードしてください。
- class pinyin{
- var $_fp = false;
-
- function __construct() {
- $_dat = DISCUZ_ROOT."./source/include/table/py.dat";
- if (! $this->_fp)
- $this->_fp = fopen($_dat,'rb');
- }
-
-
-
- /**
- * 単純なインスタンスを返します
- * @return
- */
- function &instance() {
- static $object;
- if(empty($object)) {
- $object = new self();
- }
- return $object;
- }
- function anystring2gbk($str) {
- $encode = mb_detect_encoding($str,"ASCII,UNICODE, UTF-8,GBK,CP936,EUC-CN,BIG-5,EUC-TW");
- return ($encode != 'CP936' && $encode != 'ASCII' && $encode != 'GBK' ? iconv ($encode,'GBK',$str) : $str);
- }
- function get($str,$separator = ' ') {
- //$str = iconv('UTF-8','GBK', $str);
- $str = anystring2gbk($str); //入力エンコーディングを特定できれば、前のコード行を使用できます
- $len = strlen($str);
-
- $i = 0;$ result = array( );
- while ($i < $len) {
- $s = ord($str{$i});
- if ($s > 160) {
- $word = $this-> word2py($s ,ord($str{++$i}));
- } else {
- $word = $str{$i};
- }
- $result[] = $word;
- ++$i;
- }
- return implode($separator,$result);
- }
-
- プライベート関数 word2py($h,$l) {
- $high = $h - 0x81
- $low = $l - 0x40;
- // 計算オフセット位置
- $off = ($high
- // オフ値を決定します
- if ($off return chr($h) .chr($ l);
- }
- fseek($this->_fp, $off * 8, SEEK_SET);
- $ret = fread($this->_fp, 8);
- $ret = unpack(' a8py', $ ret);
- return $ret['py'];
-
- }
-
- function __destruct() {
- if ($this->_fp)
- fclose($this->_fp);
- }
- }
-
- ?>
コードをコピー
|