Rumah >pangkalan data >tutorial mysql >Bagaimana Mengendalikan Aksara Cyrillic dengan betul dalam MySQL dan PHP Menggunakan UTF-8?

Bagaimana Mengendalikan Aksara Cyrillic dengan betul dalam MySQL dan PHP Menggunakan UTF-8?

DDD
DDDasal
2024-12-13 19:36:27358semak imbas

How to Properly Handle Cyrillic Characters in MySQL and PHP Using UTF-8?

Penyelesaian Masalah MySQL dan PHP: Aksara Cyrillic dalam UTF-8 [Pendua]

Ramai pembangun menghadapi cabaran apabila mengendalikan aksara Cyrillic dalam pangkalan data MySQL menggunakan PHP. Isu ini biasanya berpunca daripada percanggahan pengekodan antara pangkalan data, kod PHP dan set aksara.

Untuk menyelesaikan isu ini, perhatian yang teliti mesti diberikan untuk memastikan bahawa UTF-8 digunakan secara konsisten sepanjang keseluruhan saluran paip aplikasi.

Penting Pertimbangan:

  • Pengekodan Fail PHP: Pastikan fail PHP anda disimpan dalam UTF-8 tanpa BOM (Byte Order Mark). Sahkan ini dalam tetapan pengekodan fail editor anda.
  • Pengepala HTML dan PHP: Tetapkan pengepala dalam kedua-dua dokumen HTML dan PHP untuk menentukan pengekodan UTF-8:
<!DOCTYPE html>
<html>
<head>
  <meta charset="UTF-8">
  ...
</head>
<body>
  ...
</body>
</html>
<?php
// At the top of your PHP file, before any output:
header('Content-Type: text/html; charset=utf-8');
?>
  • Tetapan Pangkalan Data dan Jadual: Konfigurasikan MySQL anda pangkalan data dan jadual individu untuk menggunakan set aksara UTF-8 dengan pengumpulan utf8_general_ci atau utf8_unicode_ci:
ALTER DATABASE databasename CHARACTER SET utf8 COLLATE utf8_unicode_ci;
ALTER TABLE tablename CONVERT TO CHARACTER SET utf8 COLLATE utf8_unicode_ci;
  • mysqli_* Konfigurasi Sambungan: Tetapkan set aksara sambungan kepada UTF -8 selepas menyambung:
<?php
$conn = new mysqli($servername, $username, $password, $dbname);
$conn->set_charset("utf8");
?>
  • Pengekodan JSON: Apabila menggunakan json_encode(), pertimbangkan untuk menggunakan bendera JSON_UNESCAPED_UNICODE untuk mengelakkan penukaran heksadesimal bagi aksara khas.
  • Kesedaran Fungsi Berbilangbait: Kenali bahawa fungsi standard seperti strtolower() mungkin tidak mengendalikan aksara multibait. Gunakan fungsi khusus multibait seperti mb_strtolower().

Nota Tambahan:

  • Bezakan antara UTF-8 dengan sempang (-) dan tanpa (-). Mereka tidak boleh ditukar ganti. HTML dan PHP menggunakan UTF-8, manakala MySQL lebih suka utf8.
  • Dalam MySQL, charset dan penyusunan adalah berbeza. Tetapkan kedua-duanya kepada utf8 dan penyusunan sebaiknya kepada utf8_general_ci atau utf8_unicode_ci.
  • Untuk mengendalikan emoji, MySQL memerlukan set aksara utf8mb4 dalam kedua-dua pangkalan data dan sambungan. HTML dan PHP akan menggunakan UTF-8.

Konfigurasi untuk mysql_* dan PDO:

  • mysql_*:
mysql_set_charset('utf8');
  • PDO:
$pdo = new PDO("mysql:host=localhost;dbname=database;charset=utf8", "user", "pass");

Atas ialah kandungan terperinci Bagaimana Mengendalikan Aksara Cyrillic dengan betul dalam MySQL dan PHP Menggunakan UTF-8?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn