ホームページ >バックエンド開発 >PHPチュートリアル >PHP によってデータベースに書き込まれる中国語の文字化けの問題
ステートメント: この記事は http://www.jb51.net/article/30123.htm から引用しています
PHP ページの UTF-8 エンコードへの変換の問題
1 コードの先頭に次の行を追加します。
header("Content-Type: text/html;charset=utf-8");
<span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">2.PHP文件编码问题 </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8, </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">如果是ANSI,需要将编码改成:UTF-8。 </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">3.PHP文件头BOM问题: </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">PHP文件一定不可以有BOM标签 </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">否则,会出现session不能使用的情况,并有类似的提示: </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">Warning: session_start() [function.session-start]: Cannot send session cache limiter - headers already sent </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">这是因为,在执行session_start() 的时候,整个页面不能有输出,但是当由于前PHP页面存在BOM标签, </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">PHP把这个BOM标签当成是输出了,所以就出错了! </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">所以PHP页面一定要删除BOM标签 </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">删除这个BOM标签的方法: </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">1.可以用Dreamweaver打开文件,并重新保存,即可以去除BOM标签! </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">2.可以用EditPlus打开文件,并在菜单“首选项”->“文件”->"UTF-8标识",设置为:“总是删除签名”, </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">然后保存文件,即可以去除BOM标签! </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">4.PHP以附件形式保存文件的时候,UTF-8编码问题: </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">PHP以附件形式保存文件,文件名必须是GB2312编码, </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">否则,如果文件名中有中文的话,将是显示乱码: </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">如果你的PHP本身是UTF-8编码格式的文件, </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">需要将文件名变量由UTF-8转成GB2312: </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">iconv("UTF-8", "GB2312", "$filename"); </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">利用程序来实例字符截取方法 </span>
<span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"></span><pre name="code" class="php">function utf8_substr($str,$len) { for($i=0;$i<$len;$i++) { $temp_str=substr($str,0,1); if(ord($temp_str) > 127){ $i++; if($i<$len){ $new_str[]=substr($str,0,3); $str=substr($str,3); } }else { $new_str[]=substr($str,0,1); $str=substr($str,1); } } return join($new_str); }MYSQL データベースで UTF-8 エンコーディングを使用する場合の問題
<span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"></span><pre name="code" class="php">CREATE DATABASE `dbname` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
<span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">创建数据表的时候:如果是该字段是存放中文的话,则需要将“整理”设置为:“utf8_general_ci”, </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">如果该字段是存放英文或数字的话,默认就可以了。 </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">相应的SQL语句,例如: </span>
<span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"></span><pre name="code" class="sql">CREATE TABLE `test` ( `id` INT NOT NULL , `name` VARCHAR( 10 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , PRIMARY KEY ( `id` ) ) ENGINE = MYISAM ;2. PHP を使用してデータベースの読み取りと書き込みを行います データベースに接続した後:
<span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"></span><pre name="code" class="php">$connection = mysql_connect($host_name, $host_user, $host_pass);2 行を追加します:
<span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"></span></span><pre name="code" class="php">mysql_query("set character set 'utf8'");//读库 mysql_query("set names 'utf8'");//写库 //其实读写都可以只加入mysql_query("set names 'utf8'")
<span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"></span></span></span><pre name="code" class="php">$conn = mysql_connect("$host","$user","$password"); mysql_query("SET NAMES 'UTF8'"); mysql_select_db("$database",$conn);次に、ページを作成するときに、次の文に注意してください:
<span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px; background-color: rgb(221, 237, 251);"><meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> </span></span></span></span>
<span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">这样不管输入数据库的中文,还是页面显示,就都正常了。 </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">在DW CS4版里,默认生成的也是utf8页面。 </span><br style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;" /><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;">同样的,如果一开始写数据库连接文件时写成: </span></span></span></span><pre name="code" class="php">mysql_query("SET NAMES 'GBK'");ページは次のようになります:
<span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"><span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"></span></span></span><pre name="code" class="cpp"><meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
<span style="font-family: tahoma, arial, 宋体; font-size: 14px; line-height: 25.2px;"></span>