Rumah >pembangunan bahagian belakang >C++ >Bagaimanakah saya boleh mengekod dan menyahkod aksara Unicode dalam C# untuk memelihara aksara bukan ASCII?

Bagaimanakah saya boleh mengekod dan menyahkod aksara Unicode dalam C# untuk memelihara aksara bukan ASCII?

Mary-Kate Olsen
Mary-Kate Olsenasal
2025-01-28 04:56:08875semak imbas

How Can I Encode and Decode Unicode Characters in C# to Preserve Non-ASCII Characters?

mengendalikan aksara bukan ascii dalam c# strings

Menukar data yang mengandungi aksara bukan ASCII, seperti huruf Yunani PI (π), memerlukan pengendalian yang teliti untuk mencegah kehilangan data atau rasuah. Kaedah pengekodan C# standard kadang -kadang menggantikan watak -watak ini dengan tanda soalan. Artikel ini menunjukkan kaedah tersuai untuk pengekodan dan penyahkodan aksara Unicode untuk memastikan pemeliharaan yang tepat.

Pengekodan aksara bukan ascii

fungsi

memproses setiap aksara dalam rentetan. Watak-watak di luar julat ASCII (di atas 127) ditukar kepada urutan Escape Hexadecimal Unicode empat angka mereka (mis., "Uxxxx"). Watak ASCII kekal tidak berubah. EncodeNonAsciiCharacters

penyahkodan yang melarikan diri dari Unicode Watak

Fungsi

menggunakan ungkapan biasa untuk mengenal pasti dan menggantikan urutan melarikan diri Unicode dengan aksara Unicode yang sepadan. Ia menghancurkan bahagian heksadesimal dari urutan melarikan diri, menukarkannya ke integer, dan membuangnya ke DecodeEncodedNonAsciiCharacters. char

Contoh dan hasil

inilah coretan kod C# yang menggambarkan proses pengekodan dan penyahkodan:

<code class="language-csharp">string unicodeString = "This string contains the Unicode character Pi(π)";
Console.WriteLine(unicodeString); // Original string

string encodedString = EncodeNonAsciiCharacters(unicodeString);
Console.WriteLine(encodedString); // Encoded string with escape sequences

string decodedString = DecodeEncodedNonAsciiCharacters(encodedString);
Console.WriteLine(decodedString); // Decoded string, matching the original</code>
Output akan menunjukkan rentetan asal, rentetan dengan aksara Unicode digantikan oleh urutan melarikan diri, dan akhirnya, rentetan yang disahkod yang betul, menunjukkan penukaran perjalanan bulat yang berjaya. Teknik ini memastikan pengendalian aksara bukan ASCII yang boleh dipercayai dalam aplikasi C# anda.

Atas ialah kandungan terperinci Bagaimanakah saya boleh mengekod dan menyahkod aksara Unicode dalam C# untuk memelihara aksara bukan ASCII?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn