Maison  >  Article  >  développement back-end  >  C# Convertir les caractères chinois en Pinyin (prend en charge les caractères multi-phonétiques)

C# Convertir les caractères chinois en Pinyin (prend en charge les caractères multi-phonétiques)

黄舟
黄舟original
2017-02-06 16:46:282522parcourir

En raison des besoins du projet, j'avais besoin d'une fonction pour convertir les caractères chinois en pinyin et en première orthographe pour les requêtes. J'ai senti que cette fonction avait fondamentalement mûri, j'ai donc recherché les codes pertinents. suivant deux articles

C# Convertir les caractères chinois en pinyin (prend en charge tous les caractères chinois du jeu de caractères GB2312) (http://www.cnblogs.com/cxd4321/p/4203383.html)

【Biens】Version JS des caractères chinois et Pinyin La solution ultime pour la conversion mutuelle, avec une simple méthode de saisie JS Pinyin (http://www.cnblogs.com/liuxianan/p/pinyinjs.html)

Merci aux deux blogueurs pour leur écriture complète et détaillée, tous fournissent le code source, vous pouvez vous y référer.

En raison des besoins de l'interface, j'ai fait référence au premier article. Le code source de l'auteur dans l'article peut essentiellement répondre aux besoins de conversion des caractères chinois en Pinyin. Pour d'autres caractères spéciaux, vous pouvez également ajouter et. supplément.Toutes les lacunes Il ne prend tout simplement pas en charge les caractères multi-phonétiques. Puisque nous devons prendre en charge les requêtes de caractères multi-phonétiques, j'ai vérifié d'autres articles plus tard et j'ai découvert qu'il n'y avait pas d'articles prêts à l'emploi (peut-être que mes compétences en recherche sont médiocres).

Plus tard, j'ai cherché et découvert que pour convertir les caractères chinois en pinyin, il s'avère que Microsoft a fourni Microsoft Visual Studio International Pack, et il est très puissant. Je l'ai donc essayé

Référencez d'abord le package correspondant dans nuget

et cherchez PinYinConverter

C# Convertir les caractères chinois en Pinyin (prend en charge les caractères multi-phonétiques)

Démo simple

Petit Essayez-le, c'est très simple à utiliser, utilisez simplement la classe ChineseChar directement pour le remplacement

string ch = Console.ReadLine();
ChineseChar cc = new ChineseChar(ch[0]);
var pinyins = cc.Pinyins.ToList();
pinyins.ForEach(Console.WriteLine);

Les résultats sont les suivants :

C# Convertir les caractères chinois en Pinyin (prend en charge les caractères multi-phonétiques)

Nous pouvons voir qu'il y a trois caractères polyphoniques pour 行 : hang, heng et xing. Même les symboles phonétiques sont affichés ici, ce qui est vraiment pratique. La fonction dont j'ai besoin est de saisir "bank", puis de le convertir en pinyin sous la forme "yinhang, yinheng, yinxing", et le premier pinyin est "yh, yx". Avec la classe ChineseChar, l’idée est simple.

Package de conversion de caractères chinois en pinyin

1. Divisez d'abord les caractères chinois saisis

2. Utilisez ensuite ChineseChar pour obtenir plusieurs pinyin pour chaque caractère chinois

3. Supprimez ensuite les nombres, supprimez les doublons, extrayez le premier caractère, puis combinez-les

J'ai donc écrit une classe d'assistance pour le remplacement, le code est le suivant :

public class PinYinConverterHelp
    {
        public static PingYinModel GetTotalPingYin(string str)
        {
            var chs = str.ToCharArray();
            //记录每个汉字的全拼
            Dictionary<int, List<string>> totalPingYins = new Dictionary<int, List<string>>();
            for (int i = 0; i < chs.Length; i++)
            {
                var pinyins = new List<string>();
                var ch = chs[i];
                //是否是有效的汉字
                if (ChineseChar.IsValidChar(ch))
                {
                    ChineseChar cc = new ChineseChar(ch);
                    pinyins = cc.Pinyins.Where(p => !string.IsNullOrWhiteSpace(p)).ToList();
                }
                else
                {
                    pinyins.Add(ch.ToString());
                }
                //去除声调,转小写
                pinyins = pinyins.ConvertAll(p => Regex.Replace(p, @"\d", "").ToLower());
                //去重
                pinyins = pinyins.Where(p => !string.IsNullOrWhiteSpace(p)).Distinct().ToList();
                if (pinyins.Any())
                {
                    totalPingYins[i] = pinyins;
                }
            }
            PingYinModel result = new PingYinModel();
            foreach (var pinyins in totalPingYins)
            {
                var items = pinyins.Value;
                if (result.TotalPingYin.Count <= 0)
                {
                    result.TotalPingYin = items;
                    result.FirstPingYin = items.ConvertAll(p => p.Substring(0, 1)).Distinct().ToList();
                }
                else
                {
                    //全拼循环匹配
                    var newTotalPingYins = new List<string>();
                    foreach (var totalPingYin in result.TotalPingYin)
                    {
                        newTotalPingYins.AddRange(items.Select(item => totalPingYin + item));
                    }
                    newTotalPingYins = newTotalPingYins.Distinct().ToList();
                    result.TotalPingYin = newTotalPingYins;

                    //首字母循环匹配
                    var newFirstPingYins = new List<string>();
                    foreach (var firstPingYin in result.FirstPingYin)
                    {
                        newFirstPingYins.AddRange(items.Select(item => firstPingYin + item.Substring(0, 1)));
                    }
                    newFirstPingYins = newFirstPingYins.Distinct().ToList();
                    result.FirstPingYin = newFirstPingYins;
                }
            }
            return result;
        }
    }
Résultat :

C# Convertir les caractères chinois en Pinyin (prend en charge les caractères multi-phonétiques)

J'ai essayé quelques caractères rares jusqu'à présent et ils sont tous supportés, mais je n'en ai pas essayé certains qui sont trop biaisés cependant, pour les caractères chinois généraux convertis. au pinyin, les caractères polyphonétiques sont pris en charge ici.


Ici, nous utilisons uniquement le caractère chinois pour la fonction Pinyin dans le pack d'extension Microsoft Visual Studio International Pack. En fait, il existe également des packs de langues pour le chinois, le japonais, le coréen, Anglais et autres pays. , et fournit des méthodes pour réaliser des fonctions puissantes telles que le transfert mutuel, l'acquisition, le nombre de mots et même le nombre de traits. Les amis intéressés peuvent vérifier son API par eux-mêmes.


Partage de code source


Le partage est une vertu, parfois des articles géniaux peuvent améliorer notre niveau technique, mais parfois plus les besoins se situent au niveau de l'entreprise, et le partage de nombreuses petites applications de connaissances peut nous aider à améliorer les problèmes au niveau de l'entreprise. Tant que les points de connaissances partagés sont utiles et n'induisent pas les autres en erreur, peu importe leur taille, c'est une sorte d'apprentissage, j'espère donc que tout le monde aura le courage de le partager.

Adresse : https://github.com/qq1206676756/PinYinParse

Ce qui précède est le contenu de la conversion des caractères chinois C# en Pinyin (prend en charge les caractères multi-phonétiques). veuillez faire attention au site Web PHP chinois (www .php.cn) !


Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn