Maison > Article > développement back-end > C# Convertir les caractères chinois en Pinyin (prend en charge les caractères multi-phonétiques)
En raison des besoins du projet, j'avais besoin d'une fonction pour convertir les caractères chinois en pinyin et en première orthographe pour les requêtes. J'ai senti que cette fonction avait fondamentalement mûri, j'ai donc recherché les codes pertinents. suivant deux articles
C# Convertir les caractères chinois en pinyin (prend en charge tous les caractères chinois du jeu de caractères GB2312) (http://www.cnblogs.com/cxd4321/p/4203383.html)
【Biens】Version JS des caractères chinois et Pinyin La solution ultime pour la conversion mutuelle, avec une simple méthode de saisie JS Pinyin (http://www.cnblogs.com/liuxianan/p/pinyinjs.html)
Merci aux deux blogueurs pour leur écriture complète et détaillée, tous fournissent le code source, vous pouvez vous y référer.
En raison des besoins de l'interface, j'ai fait référence au premier article. Le code source de l'auteur dans l'article peut essentiellement répondre aux besoins de conversion des caractères chinois en Pinyin. Pour d'autres caractères spéciaux, vous pouvez également ajouter et. supplément.Toutes les lacunes Il ne prend tout simplement pas en charge les caractères multi-phonétiques. Puisque nous devons prendre en charge les requêtes de caractères multi-phonétiques, j'ai vérifié d'autres articles plus tard et j'ai découvert qu'il n'y avait pas d'articles prêts à l'emploi (peut-être que mes compétences en recherche sont médiocres).
Plus tard, j'ai cherché et découvert que pour convertir les caractères chinois en pinyin, il s'avère que Microsoft a fourni Microsoft Visual Studio International Pack, et il est très puissant. Je l'ai donc essayé
Référencez d'abord le package correspondant dans nuget
et cherchez PinYinConverter
Démo simple
Petit Essayez-le, c'est très simple à utiliser, utilisez simplement la classe ChineseChar directement pour le remplacement
string ch = Console.ReadLine(); ChineseChar cc = new ChineseChar(ch[0]); var pinyins = cc.Pinyins.ToList(); pinyins.ForEach(Console.WriteLine);
Les résultats sont les suivants :
Nous pouvons voir qu'il y a trois caractères polyphoniques pour 行 : hang, heng et xing. Même les symboles phonétiques sont affichés ici, ce qui est vraiment pratique. La fonction dont j'ai besoin est de saisir "bank", puis de le convertir en pinyin sous la forme "yinhang, yinheng, yinxing", et le premier pinyin est "yh, yx". Avec la classe ChineseChar, l’idée est simple.
Package de conversion de caractères chinois en pinyin
1. Divisez d'abord les caractères chinois saisis
2. Utilisez ensuite ChineseChar pour obtenir plusieurs pinyin pour chaque caractère chinois
3. Supprimez ensuite les nombres, supprimez les doublons, extrayez le premier caractère, puis combinez-les J'ai donc écrit une classe d'assistance pour le remplacement, le code est le suivant :public class PinYinConverterHelp { public static PingYinModel GetTotalPingYin(string str) { var chs = str.ToCharArray(); //记录每个汉字的全拼 Dictionary<int, List<string>> totalPingYins = new Dictionary<int, List<string>>(); for (int i = 0; i < chs.Length; i++) { var pinyins = new List<string>(); var ch = chs[i]; //是否是有效的汉字 if (ChineseChar.IsValidChar(ch)) { ChineseChar cc = new ChineseChar(ch); pinyins = cc.Pinyins.Where(p => !string.IsNullOrWhiteSpace(p)).ToList(); } else { pinyins.Add(ch.ToString()); } //去除声调,转小写 pinyins = pinyins.ConvertAll(p => Regex.Replace(p, @"\d", "").ToLower()); //去重 pinyins = pinyins.Where(p => !string.IsNullOrWhiteSpace(p)).Distinct().ToList(); if (pinyins.Any()) { totalPingYins[i] = pinyins; } } PingYinModel result = new PingYinModel(); foreach (var pinyins in totalPingYins) { var items = pinyins.Value; if (result.TotalPingYin.Count <= 0) { result.TotalPingYin = items; result.FirstPingYin = items.ConvertAll(p => p.Substring(0, 1)).Distinct().ToList(); } else { //全拼循环匹配 var newTotalPingYins = new List<string>(); foreach (var totalPingYin in result.TotalPingYin) { newTotalPingYins.AddRange(items.Select(item => totalPingYin + item)); } newTotalPingYins = newTotalPingYins.Distinct().ToList(); result.TotalPingYin = newTotalPingYins; //首字母循环匹配 var newFirstPingYins = new List<string>(); foreach (var firstPingYin in result.FirstPingYin) { newFirstPingYins.AddRange(items.Select(item => firstPingYin + item.Substring(0, 1))); } newFirstPingYins = newFirstPingYins.Distinct().ToList(); result.FirstPingYin = newFirstPingYins; } } return result; } }Résultat : J'ai essayé quelques caractères rares jusqu'à présent et ils sont tous supportés, mais je n'en ai pas essayé certains qui sont trop biaisés cependant, pour les caractères chinois généraux convertis. au pinyin, les caractères polyphonétiques sont pris en charge ici.