>  기사  >  백엔드 개발  >  PHP_php 예제로 생성된 중국어 병음 첫 문자 도구 클래스 공유

PHP_php 예제로 생성된 중국어 병음 첫 문자 도구 클래스 공유

WBOY
WBOY원래의
2016-05-16 20:28:401096검색

코드는 매우 간단합니다. 여기에는 BB가 많지 않습니다. 댓글을 읽어보세요. 댓글을 이해하지 못하는 친구는 PHP를 놓아주세요! ! !

코드 복사 코드는 다음과 같습니다.

/**
* 중국어 병음 초기 도구
* 참고: 영어 문자열: 변경되지 않고 반환됨(숫자 포함) 예: .abc123 => * 중국어 문자열: 병음의 첫 번째 문자를 반환합니다. 예: 테스트 문자열 => * 중국어-영어 혼합 문자열: 병음과 영어의 첫 번째 문자를 반환합니다. 예: IiIj => * 예.
* $py = 새로운 str2PY();
*
* $result = $py->getInitials('Jay Chou');
*
* //이니셜 문자 가져오기
* $result = $py->getFirstString('abc') //A
* $resutl = $py->getFirstString("Jay Chou") //Z
*
*/
클래스 str2py
{
    개인 $_pinyins = 배열(
=> '아',
=> 'B',
=> 'ㄷ',
=> '디',
=> 'E',
=> 'F',
=> 'G',
=> 'ㅎ',
=> '제이',
=> '케이',
=> '엘',
=> '엠',
=> 'ㄴ',
=> '오',
=> 'P',
=> '큐',
=> '알',
=> '에스',
=> '티',
=> 'W',
=> '엑스',
=> 'Y',
=> 'Z',
    );
    개인 $_charset = null;
    /**
* 생성자, 필수 인코딩 기본값 지정: utf-8
* utf-8, gb2312 지원
*
* @param 알 수 없는_유형 $charset
​​*/
    공개 함수 __construct($charset = 'utf-8')
    {
        $this->_charset = $charset;
    }
    /**
* 중국어 문자열 하위 문자열
*
* @param 문자열 $str
* @param int $start
* @param int $len
* @return 문자열
​​*/
    개인 함수 _msubstr($str, $start, $len)
    {
        $start = $start * 2;
        $len = $len * 2;
        $strlen = strlen($str);
        $결과 = '';
        for ($i = 0; $i < $strlen; $i )
        {
            if ($i >= $start && $i < ($start $len))
            {
                if (ord(substr($str, $i, 1)) > 129)
                {
                    $result .= substr($str, $i, 2);
                }
                그 외
                {
                    $result .= substr($str, $i, 1);
                }
            }
            if (ord(substr($str, $i, 1)) > 129)
            {
                $i ;
            }
        }
        $결과 반환;
    }
    /**
* 문자열은 배열(한자 또는 한 문자 단위)로 나누어집니다
*
* @param 문자열 $str
* @return 배열
​​*/
    개인 함수 _cutWord($str)
    {
        $words = 배열();
        동안($str != "")
        {
            if ($this->_isAscii($str))
            {/* 비중문 */
                $words[] = $str[0];
                $str = substr($str, strlen($str[0]));
            }
            그 외
            {
                $word = $this->_msubstr($str, 0, 1);
                $words[] = $word;
                $str = substr($str, strlen($word));
            }
        }
        $단어 반환;
    }
    /**
* 문자가 ASCII 문자인지 확인
*
* @param 문자열 $char
* @return 부울
​​*/
    개인 함수 _isAscii($char)
    {
        return ( ord(substr($char, 0, 1)) < 160 );
    }
    /**
* 문자열의 처음 3자가 ASCII 문자인지 확인
*
* @param 문자열 $str
* @return 부울
​​*/
    개인 함수 _isAsciis($str)
    {
        $len = strlen($str) >= 3 ? 3 : 2;
        $chars = 배열();
        for ($i = 1; $i         {
            $chars[] = $this->_isAscii($str[$i]) ? '예' : '아니요';
        }
        $result = array_count_values($chars);
        if (비어 있음($result['no']))
        {
            true를 반환합니다.
        }
        false를 반환합니다.
    }
    /**
* 중국어 문자열의 첫 병음 문자를 가져옵니다
*
* @param 문자열 $str
* @return 문자열
​​*/
    공개 함수 getInitials($str)
    {
        if (비어 있음($str))
            반환 '';
        if ($this->_isAscii($str[0]) && $this->_isAsciis($str))
        {
            $str;
반환         }
        $결과 = 배열();
        if ($this->_charset == 'utf-8')
        {
            $str = iconv('utf-8', 'gb2312', $str);
        }
        $words = $this->_cutWord($str);
        foreach($words를 $word로)
        {
            if ($this->_isAscii($word))
            {/* 비중문 */
                $result[] = $word;
                        계속;
            }
$code = ord(substr($word, 0, 1)) * 1000 ord(substr($word, 1, 1));
                          /* 병음 A--Z의 첫 글자를 가져옵니다 */
If (($i = $this->_search($code)) != -1)
                {
                     $result[] = $this->_pinyins[$i];
            }
}
          return strtoupper(implode('', $result));
}
/**
* 20140624 wangtianbao 이니셜 받기
* @param 문자열 $str
* * @return 문자열
​​*/
공개 함수 getFirstString($str)
{
                     //먼저 중국어를 문자로 변환합니다.           $new_string = $this->getInitials($str);
           if (비어 있음($new_string))
            {
              '' 반환;
}
        그 외
            {
                return strtoupper(substr($new_string, 0, 1));
}
}
비공개 함수 _getChar($ascii)
{
($ascii >= 48 && $ascii <= 57)
            {
                return chr($ascii) /* 숫자 */
}
          elseif($ascii >= 65 && $ascii <= 90)
            {
                 return chr($ascii); }
          elseif($ascii >= 97 && $ascii <= 122)
            {
               return chr($ascii - 32) /* a--z */
}
        그 외
            {
             return '-' /* 기타 */
}
}
/**
* 필수 한자 내부코드(gb2312)에 해당하는 병음문자(이분법)를 찾아보세요
*
* @param int $code
* @return int
​​*/
비공개 기능 _search($code)
{
           $data = array_keys($this->_pinyins);
         $lower = 0;
          $upper = sizeof($data) - 1;
          $middle = (int) round(($lower $upper) / 2);
($code < $data[0])
              -1을 반환합니다.
           (;;)
            {
($하위 > $상위)
                {
$data[$lower - 1] 반환;
            }
                $tmp = (int) round(($lower $upper) / 2);
만약 (!isset($data[$tmp]))
                {
                     $data[$middle] 반환;
            }
           그 외
                {
                    $middle = $tmp;
            }
If ($data[$middle] < $code)
                {
                    $lower = (int) $middle 1;
            }
               else if ($data[$middle] == $code)
                {
                      $data[$middle] 반환;
            }
           그 외
                {
$upper = (int) $middle - 1;
            }
}
}
}

한자의 첫 글자를 구하는 것은 현재 거의 모든 프로젝트에 필요한 기능입니다. 여기서 추천하는 코드는 제 프로젝트에서도 사용되는 비교적 효율적인 코드입니다. 자유롭게 연락주세요. 메시지를 남겨주시면 함께 진행하겠습니다

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.