Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Tatasusunan yang dipisahkan koma php tidak boleh dipisahkan

Tatasusunan yang dipisahkan koma php tidak boleh dipisahkan

王林
王林asal
2023-05-11 09:27:36583semak imbas

Dalam PHP, menukar rentetan kepada tatasusunan ialah operasi yang sangat biasa. Biasanya, kita boleh menggunakan fungsi pemisahan rentetan explode() untuk membelah rentetan menggunakan aksara yang ditentukan sebagai pembatas, dan kemudian meletakkan subrentetan terbelah ke dalam tatasusunan.

Sebagai contoh, kod berikut akan membelah rentetan 1,2,3,4,5 mengikut koma dan menyimpannya dalam tatasusunan:

$str = "1,2,3,4,5";
$arr = explode(",", $str);
print_r($arr); // 输出 Array ( [0] => 1 [1] => 2 [2] => 3 [3] => 4 [4] => 5 )

Walau bagaimanapun, dalam pembangunan sebenar kita mungkin menghadapi beberapa masalah keanehan. Sebagai contoh, dalam beberapa kes, rentetan yang dipisahkan koma tidak boleh dipisahkan secara normal, mengakibatkan ketidakupayaan untuk mendapatkan nombor dan nilai elemen tatasusunan yang betul.

Jadi bagaimana masalah ini timbul? Mari kita bincangkan secara terperinci di bawah.

Punca masalah

Dalam kod PHP, koma sering digunakan sebagai pembatas. Walau bagaimanapun, dalam beberapa kes, koma mungkin mewakili lebih daripada satu aksara, seperti aksara berbilang bait atau aksara kawalan khas.

Jika rentetan mengandungi aksara khas ini, anda perlu lebih berhati-hati apabila menggunakan explode() untuk membelah. Berikut adalah beberapa contoh khusus untuk digambarkan.

Aksara berbilang bait

Dalam pangkalan data MySQL, jenis medan tertentu selalunya ditentukan sebagai set aksara Cina, seperti utf8 atau utf8mb4. Sesetengah aksara dalam set aksara ini mungkin berbilang bait, seperti "aksara Cina" yang memerlukan tiga bait ruang untuk disimpan.

Jika kita cuba memisahkan rentetan yang terdiri daripada aksara berbilang bait, kita mungkin menghadapi beberapa masalah. Dalam sesetengah kes, beberapa aksara tambahan akan ditambah secara automatik antara aksara pembahagian tertentu, mengakibatkan ralat pembahagian.

Berikut ialah contoh:

$str = "中,文,汉,字";
$arr = explode(",", $str);
print_r($arr); // 输出 Array ( [0] => 中 [1] => 文í [2] => åŒ [3] => å­ )

Seperti yang anda lihat, rentetan yang terdiri daripada aksara berbilang bait akan menyebabkan ralat selepas pemisahan. Ini kerana apabila PHP memproses aksara berbilang bait, ia perlu menukar pengekodannya kepada format binari sebelum diproses. Mungkin terdapat perbezaan antara aksara binari yang ditukar dan aksara asal, mengakibatkan hasil pembahagian yang salah.

Watak khas

Selain aksara berbilang bait, terdapat beberapa aksara khas yang mungkin juga menyebabkan ralat pembahagian. Contohnya, apabila melakukan operasi belah pada rentetan yang terdiri daripada pemulangan pengangkutan dan suapan talian, beberapa masalah pelik mungkin berlaku.

Berikut ialah contoh:

$str = "a,
,b,
,c";
$arr = explode(",
", $str);
print_r($arr); // 输出 Array ( [0] => a [1] => b [2] => c )

Dalam contoh ini, memandangkan rentetan mengandungi carriage return dan aksara suapan baris, ia gagal apabila cuba dipecah dengan `,
` Sesetengah masalah akan timbul. Khususnya: beberapa ruang akan ditambah antara aksara pembahagi, sistem pengendalian yang berbeza dan penyunting teks mengendalikan pemulangan pengangkutan dan suapan talian secara berbeza, dsb.

Jadi, dalam kes ini, kita boleh cuba menggunakan ungkapan biasa untuk pemadanan dan pembahagian yang lebih tepat.

Penyelesaian

Untuk mengelakkan masalah bahawa rentetan yang dipisahkan koma tidak boleh dipisahkan dengan betul, kita boleh cuba menggunakan beberapa fungsi khusus untuk menyelesaikannya.

fungsi preg_split

Gunakan fungsi terbina dalam PHP preg_split() untuk melakukan pemadanan dan pemisahan ungkapan biasa dengan mudah. Berikut ialah contoh penggunaan preg_split() untuk membelah:

$str = "a,
,b,
,c";
$arr = preg_split('/,
/', $str);
print_r($arr); // 输出 Array ( [0] => a [1] => b [2] => c )

Seperti yang anda lihat, selepas menggunakan preg_split() untuk membelah rentetan yang dipisahkan koma, hasilnya konsisten dengan contoh sebelumnya.

Memandangkan fungsi preg_split adalah berdasarkan padanan ungkapan biasa dan pembahagian, ia boleh digunakan pada kandungan rentetan dan senario pembatas yang berbeza.

fungsi mb_split

Satu lagi penyelesaian yang mungkin adalah menggunakan fungsi terbina dalam PHP mb_split() untuk operasi pemisahan. Tidak seperti preg_split(), mb_split() tidak bergantung pada ungkapan biasa untuk pembahagian.

Berikut ialah contoh pemisahan menggunakan fungsi mb_split():

$str = "中,文,汉,字";
$arr = mb_split(",", $str);
print_r($arr); // 输出 Array ( [0] => 中 [1] => 文 [2] => 汉 [3] => 字 )

Seperti yang anda lihat, menggunakan mb_split() untuk membelah rentetan yang terdiri daripada aksara berbilang bait menghasilkan hasilnya ialah betul.

Ringkasan

Dalam PHP, menukar rentetan dipisahkan koma kepada tatasusunan ialah operasi biasa. Walau bagaimanapun, dalam pembangunan sebenar, kita mungkin menghadapi beberapa keadaan khas, seperti aksara berbilang bait, aksara khas, dsb., mengakibatkan nilai elemen tatasusunan yang dipisahkan koma tidak dapat memperoleh nilai yang betul.

Untuk mengelakkan masalah ini, kami boleh cuba menggunakan fungsi terbina dalam PHP preg_split() atau mb_split() untuk operasi pemisahan rentetan. Kedua-dua kaedah boleh menyelesaikan masalah rentetan yang dibatasi koma tidak dipecah dengan betul, dan memberikan kelebihan berbeza yang sesuai untuk senario yang berbeza.

Atas ialah kandungan terperinci Tatasusunan yang dipisahkan koma php tidak boleh dipisahkan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn