>백엔드 개발 >PHP 튜토리얼 >php는 중국어 문자열의 첫 글자를 얻습니다

php는 중국어 문자열의 첫 글자를 얻습니다

WBOY
WBOY원래의
2016-07-25 09:01:241359검색
碰到一个中文字符串排序的问题,要用到获取中文的第一个字母,程序可以获取任意字符串的首字母.
原理就是根据gb2312编码是按拼音排序.不熟悉gb2312的可以看下编码方式.
来源: http://www.phpman.cn
  1. $limit=array( //gb2312 拼音排序
  2. array(45217,45252), //A
  3. array(45253,45760), //B
  4. array(45761,46317), //C
  5. array(46318,46825), //D
  6. array(46826,47009), //E
  7. array(47010,47296), //F
  8. array(47297,47613), //G
  9. array(47614,48118), //H
  10. array(0,0), //I
  11. array(48119,49061), //J
  12. array(49062,49323), //K
  13. array(49324,49895), //L
  14. array(49896,50370), //M
  15. array(50371,50613), //N
  16. array(50614,50621), //O
  17. array(50622,50905), //P
  18. array(50906,51386), //Q
  19. array(51387,51445), //R
  20. array(51446,52217), //S
  21. array(52218,52697), //T
  22. array(0,0), //U
  23. array(0,0), //V
  24. array(52698,52979), //W
  25. array(52980,53688), //X
  26. array(53689,54480), //Y
  27. array(54481,55289), //Z
  28. );
  29. $str="A:这是一个测试程序1";
  30. $str= iconv("UTF-8","gb2312", $str);
  31. echo $str."
    ";
  32. $i=0;
  33. while($i $tmp=bin2hex(substr($str,$i,1));
  34. if($tmp>='B0'){ //汉字的开始
  35. $t=getLetter(hexdec(bin2hex(substr($str,$i,2))));
  36. printf("%c",$t==-1 ? '*' : $t );
  37. $i =2;
  38. }
  39. else{
  40. printf("%s",substr($str,$i,1));
  41. $i ;
  42. }
  43. }
  44. function getLetter($num){
  45. global $limit;
  46. $char_index=65;
  47. foreach($limit as $k=>$v){
  48. if($num>=$v[0] && $num<=$v[1]){
  49. $char_index =$k;
  50. return $char_index;
  51. }
  52. }
  53. return -1;
  54. }
  55. ?>
复制代码


성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.