코드는 매우 간단합니다. 여기에는 BB가 많지 않습니다. 댓글을 읽어보세요. 댓글을 이해하지 못하는 친구는 PHP를 놓아주세요! ! !
/**
* 중국어 병음 초기 도구
* 참고: 영어 문자열: 변경되지 않고 반환됨(숫자 포함) 예: .abc123 =>
* 중국어 문자열: 병음의 첫 번째 문자를 반환합니다. 예: 테스트 문자열 =>
* 중국어-영어 혼합 문자열: 병음과 영어의 첫 번째 문자를 반환합니다. 예: IiIj =>
* 예.
* $py = 새로운 str2PY();
*
* $result = $py->getInitials('Jay Chou');
*
* //이니셜 문자 가져오기
* $result = $py->getFirstString('abc') //A
* $resutl = $py->getFirstString("Jay Chou") //Z
*
*/
클래스 str2py
{
개인 $_pinyins = 배열(
=> '아',
=> 'B',
=> 'ㄷ',
=> '디',
=> 'E',
=> 'F',
=> 'G',
=> 'ㅎ',
=> '제이',
=> '케이',
=> '엘',
=> '엠',
=> 'ㄴ',
=> '오',
=> 'P',
=> '큐',
=> '알',
=> '에스',
=> '티',
=> 'W',
=> '엑스',
=> 'Y',
=> 'Z',
);
개인 $_charset = null;
/**
* 생성자, 필수 인코딩 기본값 지정: utf-8
* utf-8, gb2312 지원
*
* @param 알 수 없는_유형 $charset
*/
공개 함수 __construct($charset = 'utf-8')
{
$this->_charset = $charset;
}
/**
* 중국어 문자열 하위 문자열
*
* @param 문자열 $str
* @param int $start
* @param int $len
* @return 문자열
*/
개인 함수 _msubstr($str, $start, $len)
{
$start = $start * 2;
$len = $len * 2;
$strlen = strlen($str);
$결과 = '';
for ($i = 0; $i < $strlen; $i )
{
if ($i >= $start && $i < ($start $len))
{
if (ord(substr($str, $i, 1)) > 129)
{
$result .= substr($str, $i, 2);
}
그 외
{
$result .= substr($str, $i, 1);
}
}
if (ord(substr($str, $i, 1)) > 129)
{
$i ;
}
}
$결과 반환;
}
/**
* 문자열은 배열(한자 또는 한 문자 단위)로 나누어집니다
*
* @param 문자열 $str
* @return 배열
*/
개인 함수 _cutWord($str)
{
$words = 배열();
동안($str != "")
{
if ($this->_isAscii($str))
{/* 비중문 */
$words[] = $str[0];
$str = substr($str, strlen($str[0]));
}
그 외
{
$word = $this->_msubstr($str, 0, 1);
$words[] = $word;
$str = substr($str, strlen($word));
}
}
$단어 반환;
}
/**
* 문자가 ASCII 문자인지 확인
*
* @param 문자열 $char
* @return 부울
*/
개인 함수 _isAscii($char)
{
return ( ord(substr($char, 0, 1)) < 160 );
}
/**
* 문자열의 처음 3자가 ASCII 문자인지 확인
*
* @param 문자열 $str
* @return 부울
*/
개인 함수 _isAsciis($str)
{
$len = strlen($str) >= 3 ? 3 : 2;
$chars = 배열();
for ($i = 1; $i
{
$chars[] = $this->_isAscii($str[$i]) ? '예' : '아니요';
}
$result = array_count_values($chars);
if (비어 있음($result['no']))
{
true를 반환합니다.
}
false를 반환합니다.
}
/**
* 중국어 문자열의 첫 병음 문자를 가져옵니다
*
* @param 문자열 $str
* @return 문자열
*/
공개 함수 getInitials($str)
{
if (비어 있음($str))
반환 '';
if ($this->_isAscii($str[0]) && $this->_isAsciis($str))
{
$str;
반환
}
$결과 = 배열();
if ($this->_charset == 'utf-8')
{
$str = iconv('utf-8', 'gb2312', $str);
}
$words = $this->_cutWord($str);
foreach($words를 $word로)
{
if ($this->_isAscii($word))
{/* 비중문 */
$result[] = $word;
계속;
}
$code = ord(substr($word, 0, 1)) * 1000 ord(substr($word, 1, 1));
/* 병음 A--Z의 첫 글자를 가져옵니다 */
If (($i = $this->_search($code)) != -1)
{
$result[] = $this->_pinyins[$i];
}
}
return strtoupper(implode('', $result));
}
/**
* 20140624 wangtianbao 이니셜 받기
* @param 문자열 $str
* * @return 문자열
*/
공개 함수 getFirstString($str)
{
//먼저 중국어를 문자로 변환합니다.
$new_string = $this->getInitials($str);
if (비어 있음($new_string))
{
'' 반환;
}
그 외
{
return strtoupper(substr($new_string, 0, 1));
}
}
비공개 함수 _getChar($ascii)
{
($ascii >= 48 && $ascii <= 57)
{
return chr($ascii) /* 숫자 */
}
elseif($ascii >= 65 && $ascii <= 90)
{
return chr($ascii);
}
elseif($ascii >= 97 && $ascii <= 122)
{
return chr($ascii - 32) /* a--z */
}
그 외
{
return '-' /* 기타 */
}
}
/**
* 필수 한자 내부코드(gb2312)에 해당하는 병음문자(이분법)를 찾아보세요
*
* @param int $code
* @return int
*/
비공개 기능 _search($code)
{
$data = array_keys($this->_pinyins);
$lower = 0;
$upper = sizeof($data) - 1;
$middle = (int) round(($lower $upper) / 2);
($code < $data[0])
-1을 반환합니다.
(;;)
{
($하위 > $상위)
{
$data[$lower - 1] 반환;
}
$tmp = (int) round(($lower $upper) / 2);
만약 (!isset($data[$tmp]))
{
$data[$middle] 반환;
}
그 외
{
$middle = $tmp;
}
If ($data[$middle] < $code)
{
$lower = (int) $middle 1;
}
else if ($data[$middle] == $code)
{
$data[$middle] 반환;
}
그 외
{
$upper = (int) $middle - 1;
}
}
}
}
한자의 첫 글자를 구하는 것은 현재 거의 모든 프로젝트에 필요한 기능입니다. 여기서 추천하는 코드는 제 프로젝트에서도 사용되는 비교적 효율적인 코드입니다. 자유롭게 연락주세요. 메시지를 남겨주시면 함께 진행하겠습니다