Rumah  >  Artikel  >  pangkalan data  >  Bagaimana untuk menetapkan pengekodan UTF-8 dalam MySQL

Bagaimana untuk menetapkan pengekodan UTF-8 dalam MySQL

PHPz
PHPzasal
2023-04-21 11:24:163523semak imbas

MySQL ialah sistem pengurusan pangkalan data hubungan sumber terbuka yang digunakan secara meluas dalam pelbagai laman web dan aplikasi. Isu pengekodan adalah penting untuk ketepatan dan integriti data pangkalan data. Artikel ini akan memperkenalkan cara untuk menetapkan pengekodan UTF-8 dalam MySQL.

1. Memahami pengekodan UTF-8

1.1 Pengenalan kepada UTF-8

UTF-8 ialah format pengekodan aksara Unikod yang boleh mewakili semua aksara dalam standard Unicode , jadi ia digunakan secara meluas dalam pengantarabangsaan dan laman web dan aplikasi sokongan berbilang bahasa. Berbanding dengan format pengekodan aksara lain, UTF-8 menggunakan ruang storan yang lebih padat dan sesuai untuk pelbagai storan data dan acara penghantaran.

1.2 Prinsip pengekodan UTF-8

Pengekodan UTF-8 menggunakan kaedah pengekodan panjang boleh ubah Secara amnya, 1-4 bait digunakan untuk mewakili aksara, yang mana Bahagian aksara pertama digunakan untuk mewakili jumlah bilangan bait yang digunakan oleh aksara, dan bait berikut digunakan untuk menyimpan kandungan aksara tertentu. Peraturan pengekodan khusus adalah seperti berikut:

julat | UTF-8

(十六进制) (二进制)
0000 0000-0000 007F 0xxxxxxx
0000 0080-0000 07FF 110xxxxx 10xxxxxx
0000 0800-0000 FFFF 1110xxxx 10xxxxxx 10xxxxxx
0001 0000-0010 FFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

Antaranya, x menunjukkan kedudukan binari, panjang pengekodan UTF-8 adalah berdasarkan perbezaan yang berbeza. bilangan bait yang diduduki oleh aksara Perubahan boleh mewakili sehingga 4 bait aksara, iaitu "bahagian pengganti tinggi" dan "bahagian pengganti rendah" dalam Unicode.

2. Tetapkan pengekodan aksara MySQL

2.1 Ubah suai fail konfigurasi my.cnf

Dalam persekitaran Linux, fail konfigurasi MySQL ialah /etc/my.cnf , anda boleh Tambah item konfigurasi berikut untuk menetapkan pengekodan aksara pangkalan data:

[mysqld]
character-set-server=utf8
collation-server=utf8_general_ci

Di mana, character-set-server digunakan untuk menetapkan set aksara yang digunakan oleh MySQL untuk mencipta jadual secara lalai, manakala collation-server menetapkan peraturan pengumpulan yang digunakan oleh MySQL secara lalai. Di sini semuanya ditetapkan kepada pengekodan UTF-8 untuk memastikan ketepatan dan keserasian pelbagai aksara dalam pangkalan data. Selepas pengubahsuaian selesai, mulakan semula perkhidmatan MySQL untuk memuatkan semula fail konfigurasi my.cnf:

$ service mysql restart

2.2 Ubah suai pangkalan data secara langsung

Jika anda mahu ubah suai pangkalan data sedia ada Untuk mengubah suai pengekodan aksara jadual atau medan dalam pangkalan data, anda boleh menggunakan arahan SQL berikut:

UBAH nama pangkalan data PANGKALAN DATA SET CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;

di mana, utf8mb4 ialah kaedah pengekodan UTF yang disimpan dalam MySQL 8 yang boleh mewakili semua pengekodan aksara Unicode. Pada masa yang sama, perlu diingatkan bahawa versi MySQL yang berbeza mungkin menyokong kaedah pengekodan aksara yang berbeza, jadi anda perlu merujuk kepada dokumen yang sepadan apabila mengubah suai pengekodan aksara.

2.3 Ubah suai pengekodan sambungan

Dalam bahasa pengaturcaraan seperti PHP, menyambung ke MySQL juga memerlukan penetapan pengekodan aksara untuk memastikan ketepatan data. Dalam sambungan MySQLi, anda boleh menggunakan kod berikut untuk menetapkannya:

$mysqli = new mysqli("localhost", "nama pengguna", "kata laluan", "dbname");
mysqli_set_charset($ mysqli," utf8");

Dalam sambungan PDO, anda boleh menggunakan kod berikut:

$dsn = "mysql:host=localhost;dbname=dbname;charset=utf8";
$options = tatasusunan(PDO::ATTR_ERRMODE => PDO::ERRMODE_EXCEPTION);
$pdo = PDO baharu($dsn, "nama pengguna", "kata laluan", $options);

3. Ringkasan

Sebagai pangkalan data hubungan yang digunakan secara meluas dalam tapak web dan aplikasi, MySQL adalah penting untuk menetapkan pengekodan aksara yang betul. Melalui pengenalan artikel ini, kami memahami prinsip pengekodan UTF-8 dan cara menetapkan pengekodan aksara dalam MySQL. Dalam pembangunan sebenar, pengekodan aksara MySQL perlu ditetapkan dengan sewajarnya mengikut keperluan dan senario yang berbeza untuk memastikan ketepatan dan integriti data.

Atas ialah kandungan terperinci Bagaimana untuk menetapkan pengekodan UTF-8 dalam MySQL. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn