ホームページ  >  記事  >  Java  >  pinyin4j を使用するチュートリアルの例

pinyin4j を使用するチュートリアルの例

PHP中文网
PHP中文网オリジナル
2017-06-20 16:27:021337ブラウズ
pinyin4jの使い方
pinyin4jは、主に中国語からさまざまな形式とニーズのピンインを取得する強力な機能を備えたpinyin4jの使い方を見てみましょう。

import java.util.HashSet;
import java.util.Set;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format。 HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.Exception.BadHanyuPinyinOutputFormatCombination;

public class PingYingChange {

/* *
* * 中国語のピンインの最初の文字を取得します。英語の文字は変更されません
* *
* @param 中国語の文字列
* @return 中国語のピンインの最初の文字
*/
public static String cn2FirstSpell(String chinese) {
StringBuffer pybf = new StringBuffer();
char[] arr = chinese.toCharArray();
HanyuPinyinOutputFormatdefaultFormat = new HanyuPinyinOutputFormat();
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
for (int i = 0; i if (arr[i] > 128) {
試してみてくださいString[] _t = PinyinHelper.toHanyuPinyinStringArray(arr[i],defaultFormat) ;
if (_t != null) {
pybf.append(_t[0].charAt(0));
} } catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
pybf.append(arr[i]);
}
}
return pybf.toString().replaceAll("\W", "").trim();
}

/**
* 中国語の文字列のピンインを取得します。英語の文字は変更されません
*
* @param chinese 中国語の文字列
* @return 中国語のピンイン
*/
public static String cn2Spell(String chinese) {
StringBuffer pybf = new StringBuffer();
char[] arr = chinese.toCharArray();
HanyuPinyinOutputFormatdefaultFormat = new HanyuPinyinOutputFormat();
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
for (int i = 0; i if (arr[i] > 128) {
試してみてくださいpybf.append(PinyinHelper.toHanyuPinyinStringArray(arr[i],defaultFormat)[ 0]);
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
pybf.append(arr[i]);
}
}
return pybf.toString();
}
public static String cnToSpell(String chines) {

String pinyinName = "";

StringBuffer strbuf = new StringBuffer();
char[] nameChar = chines.toCharArray();
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
for (int i = 0; i char name = quanbianban(nameChar[i]);
nameChar[i] = name;
if (128 < nameChar[i]) {
try {
strbuf.append(PinyinHelper.toHanyuPinyinStringArray(nameChar[i],defaultFormat)[0].charAt(0));
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
strbuf.append(nameChar[i]);
}
}

pinyinName = strbuf.toString();

return pinyinName;

}

public static char quanbianban(char quan) {

switch (quan) {

case '0':

return '0';

case '1':

return '1';

case '2 ':

return '2';

case '3':

return '3';

case '4':

return '4';

case '5':

return '5';

case '6':

return '6';

case '7':

return '7';

case '8':

return '8';

case '9':

return '9';

デフォルト:

return quan;

}
}
/**
* 文字列セットの変換文字列 (カンマ区切り)
* @author wyh
* @param stringSet
* @return
*/
public static String makeStringByStringSet(Set stringSet){
StringBuilder str = new StringBuilder();
for(String s : stringSet){
if(i == stringSet.size() - 1){
str.append(s);
}else{
str.append(s + ",");
i++; toString().toLowerCase();
}

/**
* ピンインセットを取得します
* @author wyh
* @param src
* @return Set*/
public static Set getPinyin(String src){
if(src!=null && !src.trim().equalsIgnoreCase( "")){
char[] srcChar;
srcChar=src.toCharArray();
//HanyuPinyinOutputFormat = new HanyuPinyinOutputFormat() //出力設定、大文字小文字、発音記号メソッドなど
hanYuPinOutputFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
hanYuPinOutputFormat.setToneType(HanyuPinyinVCharType.WITH_V); [][] temp = 新しい文字列[src.length()][ ] ;
for(int i=0;ichar c = srcChar[i]
//中国語または a-z または A-Z に変換されたピンインです (私の要件は中国語または a-z またはA-Z )
if(String.valueOf(c).matches("[\u4E00-\u9FA5]+")){
try{
temp[i] = PinyinHelper.toHanyuPinyinStringArray(srcChar[i], hanYuPinOutputFormat)
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace(); }
}else if(((int)c>=65 && (int)c<=90) || ((int)c>=97 && (int) ) c<=122)){
temp[i] = 新しい String[]{String.valueOf(srcChar[i])}
}else{
temp[i] = new String[]{""}; }
}
String[] pingyinArray = Exchange(temp);
Set new HashSet();
for(int i=0;ipinyinSet.add ( pingyinArray[i]);
ピンインセットを返す
}
null を返す }

/**
* 再帰
* @author wyh
* @param strJaggedArray
* @return
*/
public static String[] Exchange(String[][] strJaggedArray){
String[ ] [] temp = DoExchange(strJaggedArray);
return temp[0];
if(len >= 2){
int len1 = strJaggedArray[1] .length;
int newlen = len1*len2;
String[] temp = new String[newlen];
for(int i=0;ifor(int j= 0;jtemp[Index] = strJaggedArray[0][i] + strJaggedArray[1][j];
Index ++
}
}
String[][] newArray = 新しい文字列[len-1][];
for(int i=2;inewArray[i-1] = strJaggedArray[i];

public static void main(String[] args) throws Exception {
HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();

// UPPERCASE: 大文字 (ZHONG)
// LOWERCASE: 小文字 (Zhong)
format.setCaseType(HanyuPinyinCaseType.LOWERCASE) ; (HanyuPinyinToneType.WITH_TONE_MARK);

// WITH_V: ü (nv) を表すために v を使用します
// WITH_U_AND_COLON: ü (nu:) を表すために "u:" を使用します
// WITH_U_UNICODE: ü を直接使用します (nü)
format.setVCharType (HanyuPinyinVCharType.WITH_U_UNICODE); println(PingYingChange.cnToSpell("鎮江 abc"));
System.out.println(PingYingChange.quanbianban('o'));
String x = "囧悪い生徒は誰だと言ったここにビデオを投稿しますか?";
System.out.println(cn2FirstSpell(x));
System.out.println(cn2Spell(x)); String str = "Shan Tianfang"; System.out.println(makeStringByStringSet(getPinyin) (str))) ;
System.out.println("");
}
}






以上がpinyin4j を使用するチュートリアルの例の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。