>  기사  >  Java  >  pinyin4j 사용에 대한 예제 튜토리얼

pinyin4j 사용에 대한 예제 튜토리얼

PHP中文网
PHP中文网원래의
2017-06-20 16:27:021343검색
pinyin4j 사용
pinyin4j는 주로 중국어에서 다양한 형식과 요구에 맞는 병음을 얻습니다. pinyin4j를 사용하는 방법을 살펴보겠습니다.
 

import java.util.HashSet;
import java.util.Set;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format. HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.Exception.BadHanyuPinyinOutputFormatCombination;

public 클래스 {

   /* 변경 *
* * 중국어 병음의 첫 글자를 가져오며, 영어 문자는 변경되지 않습니다.
* *
* @param 중국어 한자 문자열
* @return 중국어 병음의 첫 글자
*/
   public static String cn2FirstSpell(String Chinese) {
           StringBuffer pybf = new StringBuffer();
           char[] arr = Chinese.toCharArray();
           HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
           defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
           defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
           for (int i = 0; i < arr.length; i++) {
                   if (arr[i] > 128) {
                           시도해 보세요 {
                                  String[] _t = PinyinHelper.toHanyuPinyinStringArray(arr[i], defaultFormat) ; ㅋㅋㅋ
                                 }
                         } catch(BadHanyuPinyinOutputFormatCombination e) {
                                  e.printStackTrace(); ㅋㅋㅋ
                 }
           }
           return pybf.toString().replaceAll("\W", "").trim();
   }

/**
* 한자 문자열의 병음 가져오기, 영어 문자는 변경되지 않은 상태로 유지됨
*
* @param 중국어 한자 문자열
* @return 중국어 병음
*/
   public static String cn2Spell(String Chinese) {
           StringBuffer pybf = new StringBuffer();
           char[] arr = Chinese.toCharArray();
           HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
           defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
           defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
           for (int i = 0; i < arr.length; i++) {
                   if (arr[i] > 128) {
                           시도해 보세요 {
                                  pybf.append(PinyinHelper.toHanyuPinyinStringArray(arr[i], defaultFormat)[ 0]);
                           } catch (BadHanyuPinyinOutputFormatCombination e) {
                                 e.printStackTrace(); ㅋㅋㅋ
                   }
           }
           return pybf.toString();
   }
public static String cnToSpell(String chines) {

String pinyinName = "";
StringBuffer strbuf = new StringBuffer();

char[] nameChar = chines.toCharArray();

HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
for (int i = 0; i < nameChar.length; i++) {
char name = quanbianban(nameChar[i]);
nameChar[i] = name;
if (128 < nameChar[i]) {
try {
strbuf.append(PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat)[0].charAt(0));
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
strbuf.append(nameChar[i]);
}
}

pinyinName = strbuf.toString();

return pinyinName;

}

public static char quanbianban(char quan) {
스위치(quan) {

케이스 '0':
return '0';

case '1':
return '1';

케이스 '2 ':
'2' 반환;

케이스 '3':
'3' 반환;

케이스 '4':
'4' 반환;

케이스 '5':
'5' 반환;

케이스 '6':
'6' 반환;

케이스 '7':
'7' 반환;

케이스 '8':
'8' 반환;

케이스 '9':
'9' 반환;

기본값:
return quan;

}
}
/**
* 문자열 집합 변환 문자열(쉼표로 구분)
* @author wyh
* @param stringSet
* @return
*/
public static String makeStringByStringSet(Set stringSet){
StringBuilder str = new StringBuilder()
int i=0;
if(i == stringSet.size() - 1){
str.append(s);
}else{
str.append(s + ",")
}
}
return str. toString().toLowerCase()
}

/**
* 병음 세트 가져오기
* @author wyh
* @param src
* @return Set*/
public static Set getPinyin(String src){
if(src!=null && !src.trim().equalsIgnoreCase( "")){
char[] srcChar;
srcChar=src.toCharArray();
//한어병음 형식 출력 클래스
HanyuPinyinOutputFormat hanYuPinOutputFormat()

//출력 설정, 대소문자, 발음 기호 메서드 등
hanYuPinOutputFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
hanYuPinOutputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE)
hanYuPinOutputFormat.setVCharType(HanyuPinyinVCharType.WITH_V);
String[][] temp = new String[src.length()][ ] ;
for(int i=0;ichar c = srcChar[i];
//중국어 또는 a-z 또는 A-Z로 변환된 병음입니다(제 요구 사항은 중국어 또는 a-z 또는 A-Z )
if(String.valueOf(c).matches("[\u4E00-\u9FA5]+")){
try{
temp[i] = PinyinHelper.toHanyuPinyinStringArray(srcChar[i], hanYuPinOutputFormat)
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
}else if(((int)c>=65 && (int)c<=90) || ((int)c>=97 && (int ) c<=122)){
temp[i] = new String[]{String.valueOf(srcChar[i])}
}else{
temp[i] = new String[]{""}; }
}
String[] pingyinArray = Exchange(temp);
Set pinyinSet = new HashSet()
for(int i=0;ipinyinSet.add ( pingyinArray[i])
}
return pinyinSet;
}
return null;
}

/**
* 재귀적
* @author wyh
* @param strJaggedArray
* @return
*/
public static String[] Exchange(String[][] strJaggedArray){
String[ ] [] temp = DoExchange(strJaggedArray);
return temp[0]; strJaggedArray.length;
if(len >= 2){
int len1 = strJaggedArray[0].length; .length;
int newlen = len1*len2;
String[] temp = new String[newlen];
for(int i=0;ifor(int j= 0;jtemp[Index] = strJaggedArray[ 0][i] + strJaggedArray[1][j]
Index ++
}
}
String[][] newArray = new String [len-1][];
for(int i=2;i< ;len;i++){
newArray[i-1] = strJaggedArray[i]
}
}

public static void main(String[] args) throws Exception {
HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();

// 대문자: 대문자(ZHONG)
// LOWERCASE: 소문자(zhong)
format.setCaseType(HanyuPinyinCaseType.LOWERCASE ; (HanyuPinyinToneType.WITH_TONE_MARK);

// WITH_V: ü를 나타내기 위해 v 사용(nv)
// WITH_U_AND_COLON: ü를 나타내기 위해 "u:" 사용(nu:)
// WITH_U_UNICODE: ü를 직접 사용하기(nü)
format.setVCharType (HanyuPinyinVCharType.WITH_U_UNICODE); println(PingYingChange.cnToSpell("Zhenjiang abc"));
System.out.println(PingYingChange.quanbianban('o'));
String x = "囧 누가 나쁜 학생이라고 말했습니까? 동영상을 게시하려면 여기로 오시겠습니까?";
System.out.println(cn2FirstSpell(x));
System.out.println(cn2Spell(x));
String str = "Shan Tianfang"; System.out.println(makeStringByStringSet( getPinyin(str)))
        System.out.println("");
}
}






위 내용은 pinyin4j 사용에 대한 예제 튜토리얼의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.