Rumah >pembangunan bahagian belakang >masalah PHP >Bagaimana untuk mengalih keluar aksara Cina dalam php dan menukarnya kepada format URL
Dalam banyak projek PHP, aksara Cina sering muncul dalam rentetan. Walau bagaimanapun, menggunakan aksara Cina dalam URL, sebagai contoh, boleh menyebabkan ralat, jadi aksara ini biasanya perlu ditukar kepada format yang boleh diterima oleh URL. Artikel ini akan menerangkan cara menggunakan PHP untuk menanggalkan aksara Cina dan menukarnya kepada format URL yang boleh diterima.
1. Cara mengalih keluar aksara Cina dalam PHP
Ungkapan biasa ialah kaedah yang boleh digunakan untuk memadankan dan memanipulasi teks alatan. Dalam PHP, anda boleh menggunakan fungsi preg_replace() dengan ungkapan biasa untuk menggantikan teks yang dipadankan.
Contoh berikut menunjukkan cara menggunakan ungkapan biasa untuk mengalih keluar aksara Cina daripada rentetan:
$str = 'Hello, 世界!'; $str = preg_replace('/[\x{4e00}-\x{9fa5}]+/u', '', $str); echo $str; // 输出:Hello, !
Dalam contoh ini, ungkapan biasa Unicode digunakan untuk memadankan aksara Cina dalam rentetan Semua aksara Cina. Dalam ungkapan biasa Unicode, x{4e00}
mewakili aksara yang pengekodan Unikodnya ialah U+4E00
, iaitu aksara pertama aksara Cina x{9fa5}
mewakili aksara yang pengekodan Unikodnya ialah U+9FA5
, iaitu aksara terakhir bagi. watak Cina.
+
dalam ungkapan biasa mewakili satu atau lebih aksara, dan parameter u
mewakili menggunakan set aksara Unicode untuk pemadanan.
mb_ereg_replace() ialah salah satu fungsi terbina dalam PHP untuk penggantian ungkapan biasa berdasarkan aksara berbilang bait. Gunakan fungsi ini untuk mengalih keluar aksara Cina daripada rentetan.
Kod berikut menunjukkan cara mb_ereg_replace() mengalih keluar aksara Cina daripada rentetan:
$str = 'Hello, 世界!'; $str = mb_ereg_replace('[\x{4e00}-\x{9fa5}]', '', $str); echo $str; // 输出:Hello, !
Dalam contoh ini, set aksara Unicode digunakan untuk memadankan aksara Cina dan menggantikannya adalah kosong. rentetan.
2. Tukar aksara Cina kepada format yang boleh diterima URL
Dalam banyak aplikasi, adalah perlu untuk menukar aksara Cina kepada format yang boleh diterima URL. Hanya aksara tertentu boleh disertakan dalam URL, seperti huruf, nombor dan beberapa aksara khas. Agar URL berfungsi dengan betul, aksara Cina dalam URL perlu ditukar kepada aksara khas.
Terdapat banyak cara untuk menukar aksara Cina kepada format yang boleh diterima oleh URL Salah satu kaedah yang lebih biasa ialah menukar aksara Cina kepada pengekodan UTF-8 dan menggunakan fungsi urlencode() untuk mengekodnya.
Kod berikut menunjukkan cara menggunakan PHP untuk menukar aksara Cina kepada pengekodan UTF-8 dan melaksanakan pengekodan URL:
$str = '你好,世界!'; $str = urlencode($str); echo $str; // 输出:%E4%BD%A0%E5%A5%BD%EF%BC%8C%E4%B8%96%E7%95%8C%EF%BC%81
Dalam contoh ini, fungsi urlencode()
menukar rentetan kepada UTF-8 dikodkan dan URL dikodkan. Apabila menggunakan rentetan yang dikodkan sebagai sebahagian daripada URL, URL tersebut dijamin berfungsi dengan betul.
3. Kesimpulan
Dalam projek PHP, anda perlu memberi perhatian kepada pengendalian aksara Cina. Aksara Cina boleh dialih keluar dengan mudah daripada rentetan menggunakan ungkapan biasa atau fungsi terbina dalam mb_ereg_replace(). Apabila menukar aksara Cina kepada format yang boleh diterima untuk URL, anda boleh menukarnya kepada pengekodan UTF-8 dan menggunakan fungsi urlencode() untuk mengekodnya. Petua ini boleh memastikan bahawa aplikasi PHP boleh mengendalikan aksara Cina dengan betul dan mengelakkan ralat dan pengecualian yang disebabkan oleh aksara Cina.
Atas ialah kandungan terperinci Bagaimana untuk mengalih keluar aksara Cina dalam php dan menukarnya kepada format URL. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!