Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk mengesahkan input aksara Cina menggunakan ungkapan biasa PHP

Bagaimana untuk mengesahkan input aksara Cina menggunakan ungkapan biasa PHP

WBOY
WBOYasal
2023-06-24 08:51:161088semak imbas

Dengan pempopularan Internet dan kemajuan pengantarabangsaan, semakin ramai pengguna datang dari pelbagai negara dan wilayah, dan kadar penggunaan input aksara Cina dalam input pengguna juga telah meningkat. Pengesahan aksara Cina adalah bahagian penting untuk beberapa tapak web Cina atau tapak web antarabangsa. Bagi pembangun, amat perlu untuk memahami cara menggunakan ungkapan biasa PHP untuk mengesahkan input aksara Cina.

PHP ialah bahasa pengaturcaraan pelayan yang biasa digunakan Ia digemari oleh ramai pembangun kerana kesederhanaan, kemudahan pembelajaran, keterbukaan dan kebebasannya. Ungkapan biasa ialah alat yang berkuasa untuk memproses teks Ia sangat mudah alih dan boleh digunakan dalam bahasa pengaturcaraan yang berbeza. Oleh itu, adalah sangat praktikal untuk mengesahkan input aksara Cina melalui ungkapan biasa PHP.

Seterusnya, saya akan memperkenalkan cara menggunakan ungkapan biasa PHP untuk mengesahkan input aksara Cina, dan cara menangani beberapa situasi khas yang mungkin berlaku dalam input aksara Cina.

1. Pengesahan ungkapan biasa PHP bagi input aksara Cina

Dalam PHP, gunakan fungsi preg_match() untuk memadankan format sintaks adalah seperti berikut:

preg_match( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]]): int|false

Antaranya, $pattern ialah corak ungkapan biasa yang akan dipadankan, $subject ialah rentetan yang akan dipadankan, dan $matches digunakan untuk menyimpan hasil padanan. Jika perlawanan berjaya, 1 dikembalikan, jika tidak 0 dikembalikan.

Untuk pengesahan input aksara Cina, kita boleh menggunakan ungkapan biasa berikut:

$pattern = '/^[u4e00-u9fa5]+$/u';

Maksud ungkapan biasa ini adalah untuk memadankan rentetan yang bermula dan berakhir dengan aksara Cina. [u4e00-u9fa5] ialah julat aksara Cina dalam pengekodan Unikod dan u menunjukkan pengekodan UTF-8.

Seterusnya, gunakan fungsi preg_match() untuk mengesahkan:

if (preg_match($pattern, $input)) {
    echo "验证成功!";
} else {
    echo "验证失败!";
}

di mana $input ialah rentetan yang akan disahkan. Jika pengesahan berjaya, keluarkan "Pengesahan berjaya!" jika tidak, keluarkan "Pengesahan gagal!";

2. Mengendalikan situasi khas dalam input aksara Cina

Untuk beberapa situasi khas, ungkapan biasa di atas mungkin perlu dilaraskan.

  1. Aksara lebar penuh

Dalam sesetengah kes, input aksara Cina mungkin menggunakan aksara lebar penuh dan bukannya aksara separuh lebar. Oleh itu, ungkapan biasa perlu dipertingkatkan:

$pattern = '/^[x{3000}-x{303F}x{4e00}-x{9fa5}x{FF00}-x{FFEF}]+$/u';

Antaranya, x{3000}-x{303F} bermaksud memadankan simbol lebar penuh dan x{FF00}-x{FFEF} bermaksud memadankan simbol Cina dan Inggeris lebar penuh.

  1. Beberapa Aksara Cina

Dalam input beberapa aksara Cina, beberapa simbol khas mungkin muncul, seperti aksara langka, radikal Cina, dsb. Untuk dapat memadankan aksara Cina ini, set aksara Unicode perlu digunakan.

$pattern = "/^[x{4e00}-x{9fa5}x{3400}-x{4DBF}x{20000}-x{2A6DF}x{2A700}-x{2B73F}x{2B740}-x{2B81F}x{2B820}-x{2CEAF}x{2CEB0}-x{2EBEF}x{2F800}-x{2FA1F}]+$/u";

Antaranya, x{3400}-x{4DBF} sepadan CJK sambungan A, x{20000}-x{2A6DF} sepadan CJK sambungan B, x{2A700}-x{2B73F} sepadan CJK sambungan C, x{2B740}-x{2B81F} sepadan CJK sambungan D, x{2B820}-x{2CEAF} sepadan CJK sambungan E, x{2CEB0}-x{2EBEF} sepadan dengan sambungan CJK F, x{2F800}-x{2FA1F} sepadan dengan sambungan serasi CJK.

  1. Ruang, baris baharu, tab dan aksara ruang putih lain

Dalam sesetengah kes, input aksara Cina mungkin mengandungi ruang, baris baharu, tab dan aksara aksara ruang kosong yang lain. Pada masa ini, anda perlu menambah pernyataan yang sepadan dengan aksara ruang putih dengan ungkapan biasa.

$pattern = '/^[\s\S]*|^[x{4e00}-x{9fa5}x{3400}-x{4DBF}x{20000}-x{2A6DF}x{2A700}-x{2B73F}x{2B740}-x{2B81F}x{2B820}-x{2CEAF}x{2CEB0}-x{2EBEF}x{2F800}-x{2FA1F}]+$/u';

Antaranya, [sS]* sepadan dengan mana-mana aksara kosong | bermaksud atau;

Dengan mengendalikan situasi istimewa ini, input aksara Cina boleh disahkan dengan lebih menyeluruh.

3. Kesimpulan

Menggunakan ungkapan biasa PHP untuk mengesahkan input aksara Cina ialah kemahiran yang sangat praktikal. Melalui ungkapan biasa yang sesuai, input aksara Cina boleh disahkan dengan berkesan. Pada masa yang sama, pelarasan yang sesuai kepada ungkapan biasa berdasarkan keadaan sebenar dapat memenuhi keperluan sebenar dengan lebih baik. Oleh itu, amat perlu bagi pembangun untuk menguasai kaedah mengesahkan input aksara Cina menggunakan ungkapan biasa PHP, dan ia juga merupakan sebahagian daripada kemahiran pengaturcaraan.

Atas ialah kandungan terperinci Bagaimana untuk mengesahkan input aksara Cina menggunakan ungkapan biasa PHP. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn