PHP+MYSQL做網站開發通常都會碰到瀏覽器輸出中文字元時亂碼,這個問題的原因主要是因為HTML內容編碼,PHP檔案編碼和MySQL資料庫編碼這三者不一致造成的。下面我們以UTF-8為例簡述如何統一這三者之間的關係。
新增一個PHP文件,命名為test_charset.php,將下面的程式碼儲存到該文件中:
<?php $charset = "utf8"; $con = mysql_connect("localhost", "root", ""); mysql_query("SET character_set_connection=$charset, character_set_results=$charset, character_set_client=binary", $con); mysql_select_db("ecshop", $con); $sql = "SELECT user_name, email FROM ecs_admin_user WHERE user_id = 4"; $result = mysql_query($sql, $con); $array = mysql_fetch_array($result, MYSQL_ASSOC); mysql_close($con); $name = $array["user_name"]; $email = $array["email"]; ?> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> </head> <body> <h1>你好, <?php echo $name; ?>!</h1> <h2>你的邮件是:<a href="mailto:<?php echo $email; ?>"><?php echo $email; ?></a></h2> </body> </html>
HTML內容編碼
上面的第22行:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
這裡我們指定了瀏覽器在解析HTML時使用UTF-8編碼 。如果這裡沒有指定,瀏覽器會使用自己預設的編碼。不同的瀏覽器預設編碼會有所不同,例如IE6是GB2312,FireFox是UTF-8。所以,上面這段程式碼如果沒有第22行,在FireFox會顯示正常,在IE6就會顯示亂碼。
PHP檔案編碼
PHP檔案本身也需要有一致的編碼。如何檢查自己的PHP檔案是哪一種編碼呢? Windows下簡單的可以用記事本來處理。用記事本開啟PHP文件,從“文件”選單中選擇“另存為...”,如下圖:
在開啟的對話框最下面有一個“編碼”的選項,目前看到的就是該文件現在的編碼。如果要變成其它的編碼,從下拉列錶框中選擇,然後點擊「儲存」按鈕。
MySQL資料庫編碼
資料庫連線成功後,應該第一時間執行一條設定編碼指令,如上面程式碼的第7行。這裡有一點要特別注意,UTF-8是正常的寫法,不過在MySQL中簡寫成了UTF8,中間沒有橫線。上面第7行是將連接編碼設定成utf8($charset="utf8"),而不是utf-8。這裡附上ECShop設定連線編碼的完整實現,供大家參考。檔案是includes/cls_mysql.php。
function set_mysql_charset($charset) { /* 如果mysql 版本是 4.1+ 以上,需要对字符集进行初始化 */ if ($this->version > '4.1') { if (in_array(strtolower($charset), array('gbk', 'big5', 'utf-8', 'utf8'))) { $charset = str_replace('-', '', $charset); } if ($charset != 'latin1') { mysql_query("SET character_set_connection=$charset, character_set_results=$charset, character_set_client=binary", $this->link_id); } } }