首页 >后端开发 >C++ >如何在C＃中编码和解码Unicode字符？

如何在C＃中编码和解码Unicode字符？

DDD原创: 2025-01-28 04:51:13570浏览

How to Encode and Decode Unicode Characters in C#?

C# 中 Unicode 字符的编码和解码

在 C# 中，Encoding 类用于字符编码和解码。但是，在处理 ASCII 范围之外的 Unicode 字符时，它存在局限性。为了保留非 ASCII 字符（例如希腊字母 Pi (π)），我们需要采用特定的技术。

Unicode 字符编码

要将 Unicode 字符编码为转义的 ASCII 字符串，我们使用以下方法：

<code class="language-csharp">static string EncodeNonAsciiCharacters(string value) {
    StringBuilder sb = new StringBuilder();
    foreach (char c in value) {
        if (c > 127) {
            string encodedValue = "\u" + ((int)c).ToString("x4");
            sb.Append(encodedValue);
        } else {
            sb.Append(c);
        }
    }
    return sb.ToString();
}</code>

此方法将非 ASCII 字符替换为其对应的转义 ASCII 形式，例如，“π” 变成 “u03a0”。

转义 ASCII 字符解码

要将转义的 ASCII 字符串解码回 Unicode，我们使用正则表达式：

<code class="language-csharp">static string DecodeEncodedNonAsciiCharacters(string value) {
    return Regex.Replace(value,
        @"\u(?<value>[a-zA-Z0-9]{4})",
        m => {
            return ((char)int.Parse(m.Groups["Value"].Value, NumberStyles.HexNumber)).ToString();
        });
}</code>

此正则表达式将所有出现的转义 Unicode 字符 (uXXXX) 替换为其对应的 Unicode 字符，例如，“u03a0” 变成 “π”。

示例用法

以下示例说明了编码和解码过程：

<code class="language-csharp">string unicodeString = "This function contains a unicode character pi (π)";
string encoded = EncodeNonAsciiCharacters(unicodeString);
string decoded = DecodeEncodedNonAsciiCharacters(encoded);
Console.WriteLine(decoded); // 输出：This function contains a unicode character pi (π)</code>

此示例在整个编码和解码过程中保留了非 ASCII 字符 Pi。

以上是如何在C＃中编码和解码Unicode字符？的详细内容。更多信息请关注PHP中文网其他相关文章！

正则表达式字符串 ASCII

声明：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：How Can I Escape and Unescape Unicode Strings in C# to Maintain ASCII Compatibility?下一篇：How Can I Encode and Decode Unicode Characters in C# to Preserve Non-ASCII Characters?

查看更多