Rumah >pembangunan bahagian belakang >C++ >Bagaimanakah Saya Boleh Mengalih Keluar Aksara Bukan ASCII daripada Rentetan dalam C#?
Mengalih keluar Aksara Bukan ASCII dalam Rentetan C# dengan cekap
Pemprosesan data selalunya memerlukan pembersihan rentetan dan mengalih keluar aksara bukan ASCII adalah tugas biasa, terutamanya untuk keserasian sistem warisan. C# menawarkan penyelesaian yang mudah menggunakan ungkapan biasa.
Pendekatan Ekspresi Biasa
Cara paling berkesan untuk menghapuskan aksara bukan ASCII adalah melalui kaedah Regex.Replace
. Begini caranya:
<code class="language-csharp">string inputString = "søme string with non-ASCII characters."; string cleanString = Regex.Replace(inputString, @"[^\u0000-\u007F]+", "");</code>
Memahami Ungkapan Biasa
Mari kita rungkai ungkapan biasa [^u0000-u007F]
:
[^...]
: Ini ialah kelas watak yang dinafikan. Ia bermaksud "padan dengan mana-mana watak yang bukan dalam kurungan."u0000-u007F
: Ini menentukan julat Unicode untuk aksara ASCII (perpuluhan 0-127).Oleh itu, keseluruhan ungkapan sepadan dengan satu atau lebih (
) aksara yang berada di luar julat ASCII.
Penjelasan Kaedah
Kaedah Regex.Replace
secara sistematik mencari inputString
untuk sebarang jujukan aksara bukan ASCII dan menggantikannya dengan rentetan kosong (""
), dengan berkesan mengalih keluarnya. cleanString
yang terhasil hanya mengandungi aksara ASCII.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengalih Keluar Aksara Bukan ASCII daripada Rentetan dalam C#?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!