在 C# 字符串比较中忽略重音字母
在 C# 中,拼写相同但重音不同的字符串通常被视为不同的实体。当需要忽略重音符号进行字符串相等性比较时,这可能会带来挑战。
为了解决这个问题,RemoveDiacritics
函数将输入字符串规范化为 NormalizationForm.FormD
并移除所有非间隔标记,有效地去除字符中的所有重音符号。然后,生成的字符串被规范化为 NormalizationForm.FormC
以恢复其原始大小写敏感性。
<code class="language-csharp">static string RemoveDiacritics(string text) { string formD = text.Normalize(NormalizationForm.FormD); StringBuilder sb = new StringBuilder(); foreach (char ch in formD) { UnicodeCategory uc = CharUnicodeInfo.GetUnicodeCategory(ch); if (uc != UnicodeCategory.NonSpacingMark) { sb.Append(ch); } } return sb.ToString().Normalize(NormalizationForm.FormC); }</code>
此函数有效地将带重音字符(例如“é”)转换为其相应的无重音等效项(例如“e”)。通过使用 NormalizationForm.FormD
和 NormalizationForm.FormC
的 Normalize
,可以在去除重音标记的同时保持大小写敏感性。
例如,以下代码演示了如何使用 RemoveDiacritics
函数在忽略重音符号的情况下比较字符串:
<code class="language-csharp">string s1 = "hello"; string s2 = "héllo"; string s1NoDiacritics = RemoveDiacritics(s1); string s2NoDiacritics = RemoveDiacritics(s2); Console.WriteLine(s1NoDiacritics == s2NoDiacritics); // 输出:True</code>
在此示例中,如果不考虑重音符号,则 s1 和 s2 将被视为不同。但是,去除重音符号后,s1NoDiacritics 和 s2NoDiacritics 变得相同,从而导致比较结果为 True。
以上是如何在忽略重音符号的情况下比较 C# 中的字符串?的详细内容。更多信息请关注PHP中文网其他相关文章!