>백엔드 개발 >PHP 튜토리얼 >GBK에서 병음으로 병음, 인터넷에 널려 있는 병음으로 GB2312가 아니라는 점에 유의하세요.

GBK에서 병음으로 병음, 인터넷에 널려 있는 병음으로 GB2312가 아니라는 점에 유의하세요.

WBOY
WBOY원래의
2016-07-25 09:07:581489검색
网络上一搜,到处都是的「PHP转拼音」,但是代码只支持GB2312,
连「骞」、「鹜」、「慧」等字都无法支持。
对于中文姓名转拼音,那个代码远远不够使用。

现在公布一个正确的GBK转拼音代码,很感谢原作者: 马明练(!hightman) 主页: http://php.twomice.net
原DEMO只支持一个字查询,我修改了成支持一段字符串,中英文均可,英文返回原文,汉字转化为拼音,并带音调。
暂不支持多音字,例如「曾」会转化为ceng2,而没有zeng1

(网络上有一个yii-chinese的PHP项目,可惜转拼音也是GB2312)


使用方法:
$str = '汉字中文abc123-= ';
$py = pinyin::instance(); //单实例,如果你愿意,$py = new pinyin(); 也可以。
echo $py->get($str);


请在页尾下载整个代码。


GBK에서 병음으로 병음, 인터넷에 널려 있는 병음으로 GB2312가 아니라는 점에 유의하세요.
  1. class pinyin{
  2. var $_fp = false;
  3. function __construct() {
  4. $_dat = DISCUZ_ROOT."./source/include/table/py.dat";
  5. if (!$this->_fp)
  6. $this->_fp = fopen($_dat,'rb');
  7. }
  8. /**
  9. * return a simple instance
  10. * @return
  11. */
  12. function &instance() {
  13. static $object;
  14. if(empty($object)) {
  15. $object = new self();
  16. }
  17. return $object;
  18. }
  19. function anystring2gbk($str) {
  20. $encode = mb_detect_encoding($str,"ASCII,UNICODE,UTF-8,GBK,CP936,EUC-CN,BIG-5,EUC-TW");
  21. return ($encode != 'CP936' && $encode != 'ASCII' && $encode != 'GBK' ? iconv($encode,'GBK',$str) : $str);
  22. }
  23. function get($str,$separator = ' ') {
  24. //$str = iconv('UTF-8','GBK',$str);
  25. $str = anystring2gbk($str); //如果您可以确定输入编码,可以使用上一行代码
  26. $len = strlen($str);
  27. $i = 0;$result = array();
  28. while ($i < $len) {
  29. $s = ord($str{$i});
  30. if ($s > 160) {
  31. $word = $this->word2py($s,ord($str{ $i}));
  32. } else {
  33. $word = $str{$i};
  34. }
  35. $result[] = $word;
  36. $i;
  37. }
  38. return implode($separator,$result);
  39. }
  40. private function word2py($h,$l) {
  41. $high = $h - 0x81;
  42. $low = $l - 0x40;
  43. // 计算偏移位置
  44. $off = ($high<<8) $low - ($high * 0x40);
  45. // 判断 off 值
  46. if ($off < 0) {
  47. return chr($h).chr($l);
  48. }
  49. fseek($this->_fp, $off * 8, SEEK_SET);
  50. $ret = fread($this->_fp, 8);
  51. $ret = unpack('a8py', $ret);
  52. return $ret['py'];
  53. }
  54. function __destruct() {
  55. if ($this->_fp)
  56. fclose($this->_fp);
  57. }
  58. }
  59. ?>
复制代码


성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
이전 기사:구구단 출력 효과다음 기사:구구단 출력 효과