ホームページ  >  記事  >  バックエンド開発  >  GBK からピンインへのピンイン変換は、インターネット上のどこにでもある GB2312 からピンインへの変換ではないことに注意してください。

GBK からピンインへのピンイン変換は、インターネット上のどこにでもある GB2312 からピンインへの変換ではないことに注意してください。

WBOY
WBOYオリジナル
2016-07-25 09:07:581443ブラウズ
インターネットで検索すると、「PHP to Pinyin」はあちこちにありますが、コードは GB2312 のみをサポートしています。
「骞」、「霜」、「慧」という単語もサポートできません。
中国語の名前をピンインに変換するには、そのコードでは十分とは言えません。

正しい GBK からピンイン コードが発表されました。オリジナルの作者: Ma Minglian (!hightman) に感謝します。ホームページ: http://php.twomice.net。
元のデモは 1 単語のクエリのみをサポートし、中国語と英語の両方の文字列をサポートするように変更しました。元のテキストは英語で返され、中国語の文字は声調付きのピンインに変換されます。
現時点では複数の発音文字はサポートされていません。たとえば、「Zeng」は ceng2 に変換されますが、zeng1 はありません。

(インターネット上にyii中国語のPHPプロジェクトがありますが、残念ながらピンイン変換もGB2312です)


使用方法:
$str = '漢字 abc123-=+';
$py = pinyin::instance(); //必要に応じて、単一インスタンスも機能します。
echo $py->get($str);


ページの最後にあるコード全体をダウンロードしてください。


GBK からピンインへのピンイン変換は、インターネット上のどこにでもある GB2312 からピンインへの変換ではないことに注意してください。
  1. class pinyin{
  2. var $_fp = false;
  3. function __construct() {
  4. $_dat = DISCUZ_ROOT."./source/include/table/py.dat";
  5. if (! $this->_fp)
  6. $this->_fp = fopen($_dat,'rb');
  7. }
  8. /**
  9. * 単純なインスタンスを返します
  10. * @return
  11. */
  12. function &instance() {
  13. static $object;
  14. if(empty($object)) {
  15. $object = new self();
  16. }
  17. return $object;
  18. }
  19. function anystring2gbk($str) {
  20. $encode = mb_detect_encoding($str,"ASCII,UNICODE, UTF-8,GBK,CP936,EUC-CN,BIG-5,EUC-TW");
  21. return ($encode != 'CP936' && $encode != 'ASCII' && $encode != 'GBK' ? iconv ($encode,'GBK',$str) : $str);
  22. }
  23. function get($str,$separator = ' ') {
  24. //$str = iconv('UTF-8','GBK', $str);
  25. $str = anystring2gbk($str); //入力エンコーディングを特定できれば、前のコード行を使用できます
  26. $len = strlen($str);
  27. $i = 0;$ result = array( );
  28. while ($i < $len) {
  29. $s = ord($str{$i});
  30. if ($s > 160) {
  31. $word = $this-> word2py($s ,ord($str{++$i}));
  32. } else {
  33. $word = $str{$i};
  34. }
  35. $result[] = $word;
  36. ++$i;
  37. }
  38. return implode($separator,$result);
  39. }
  40. プライベート関数 word2py($h,$l) {
  41. $high = $h - 0x81
  42. $low = $l - 0x40;
  43. // 計算オフセット位置
  44. $off = ($high
  45. // オフ値を決定します
  46. if ($off return chr($h) .chr($ l);
  47. }
  48. fseek($this->_fp, $off * 8, SEEK_SET);
  49. $ret = fread($this->_fp, 8);
  50. $ret = unpack(' a8py', $ ret);
  51. return $ret['py'];
  52. }
  53. function __destruct() {
  54. if ($this->_fp)
  55. fclose($this->_fp);
  56. }
  57. }
  58. ?>
コードをコピー


声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
前の記事:九九出力の効果次の記事:九九出力の効果