ホームページ  >  記事  >  ウェブフロントエンド  >  Web 開発で発生する UTF-8 エンコードの問題の概要

Web 開発で発生する UTF-8 エンコードの問題の概要

黄舟
黄舟オリジナル
2016-12-16 15:45:101140ブラウズ

主に 5 つの側面があります:

1. HTML ページを UTF-8 エンコーディングに変換する問題

2. PHP ページを UTF-8 エンコーディングに変換する問題

3. UTF-8 エンコーディングを使用する問題MYSQL データベース

4. JS 関連の UTF-8 エンコードの問題

5. FLASH 関連の UTF-8 エンコードの問題

1. HTML ページの UTF-8 エンコードの問題

1. 93f0f5c25f18dab9d176bd4f6de5d30e の後に行を追加します。 b2386ffb911b14667cb8f0f91ea547a7 の前:

020ab7d3362cd5149e310bb4b8f799bd

この順序は間違ってはいけません。b2386ffb911b14667cb8f0f91ea547a7 タグの前に追加する必要があります。そうしないと、b2386ffb911b14667cb8f0f91ea547a7 と 6e916e0f7d1e588d4f442bf645aedb2f の間に漢字が含まれる場合、表示されるタイトルが文字化けする可能性があります。

2.html ファイルのエンコーディングの問題:

エディターのメニューをクリックします: [ファイル] -> [名前を付けて保存]、現在のファイルのエンコーディングが表示されます。ファイル エンコーディングが UTF-8 であることを確認します。 ANSI です。エンコードを UTF-8 に変更する必要があります。

3. HTML ファイルのヘッダー BOM の問題:

他のエンコーディングから UTF-8 エンコーディングにファイルを変換する場合、BOM タグがファイルの先頭に追加されると、ブラウザーで表示時に文字化けが発生する場合があります。漢字。

この BOM タグを削除する方法:

1. Dreamweaver でファイルを開いて再保存すると、BOM タグを削除できます。

2. EditPlus でファイルを開き、メニューの「環境設定」->「ファイル」->「UTF-8 ID」で「署名を常に削除する」に設定し、ファイルを保存します。 BOM タグを削除できます。

4. WEB サーバーの UTF-8 エンコードの問題:

上記の手順を実行しても中国語の文字化けの問題が解決しない場合は、使用している WEB サーバーのエンコードの問題を確認してください

Apache を使用している場合は、設定してください設定ファイルの文字セットを utf-8 に変更します (ここにはメソッドのみがリストされています。特定の形式については、Apache 設定ファイルを参照してください)。

Nginx を使用している場合は、nginx.conf の charset を utf-8 に設定してください。特に「charset 」を見つけてください。 gb2312;" または同様のステートメントを、"charset utf-8;" に変更します。



2. PHP ページの UTF-8 エンコードへの変換の問題

1. 先頭に行を追加しますコード:

header("Content-Type: text/html;charset=utf-8");

2.PHP ファイルのエンコードの問題

エディタのメニューをクリックします: 「ファイル」->「保存」 「現在のファイルのエンコーディングに移動し、ファイルのエンコーディングが UTF-8 であることを確認します。ANSI の場合は、エンコーディングを UTF-8 に変更する必要があります。

3. PHP ファイルのヘッダーBOM の問題:

PHP ファイルには BOM タグがあってはなりません。そうしないと、セッションが使用できなくなり、同様のプロンプトが表示されます:

警告: session_start() [function.session-start]:セッションキャッシュを送信できません リミッター - ヘッダーはすでに送信されています

これは、session_start() の実行中に、 の場合、ページ全体を出力することはできませんが、前の PHP ページに BOM タグが存在するため、PHP は BOM タグを出力として扱うため、エラーが発生します。

そのため、PHP ページで BOM タグを削除する必要があります

この BOM タグを削除する方法:

1. Dreamweaver でファイルを開いて再保存すると、BOM タグを削除できます。

2. EditPlus でファイルを開き、メニューの「環境設定」->「ファイル」->「UTF-8 ID」で「署名を常に削除する」に設定し、ファイルを保存します。 BOM タグを削除できます。

4. PHP がファイルを添付ファイルとして保存するときの UTF-8 エンコードの問題:

PHP がファイルを添付ファイルとして保存するとき、ファイル名は GB2312 でエンコードされる必要があります。そうしないと、ファイル名に中国語が含まれる場合、文字化けする可能性があります:

PHP 自体が UTF-8 エンコード形式のファイルである場合、ファイル名変数を UTF-8 から GB2312 に変換する必要があります:

iconv("UTF-8", "GB2312", "$ filename");

5. 記事タイトルを切り詰めて表示すると、文字化けや「?」マークが表示される:

通常、記事タイトルが非常に長い場合、タイトルの一部が表示され、記事がUTF-8 でエンコードされた中国語の文字は 3 文字の幅を占めるため、タイトルは切り詰められます。インターセプトが完了していない場合、中国語の文字の幅が 1 文字または 2 文字だけである場合があります。文字化けまたは疑問符が表示されます。次の関数を使用して Title をインターセプトします。問題はありません。

function get_brief_str($str, $max_length) 
{ 
echo strlen($str) 
."<br>"; 
if(strlen($str) > $max_length) 
{ 
$check_num = 0; 
for($i=0; $i < $max_length; $i++) 
{ 
if (ord($str[$i]) > 128) 
$check_num++; 
} 

if($check_num % 3 == 0) 
$str = substr($str, 
0, $max_length)."..."; 
else if($check_num % 3 == 1) 
$str = substr($str, 
0, $max_length + 2)."..."; 
else if($check_num % 3 == 2) 
$str = 
substr($str, 0, $max_length + 1)."..."; 
} 

return $str; 
}

3. MYSQL データベースの UTF-8 エンコーディングの使用に関する問題

1. phpmyadmin を使用してデータベースを作成し、データ テーブル

データベースを作成するときは、「組織」を「utf8_general_ci 」に設定するか、次のステートメントを実行してください:

CREATE DATABASE `dbname` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;

データ テーブルを作成するとき: フィールドに中国語が格納されている場合は、「組織」を「utf8_general_ci」に設定する必要があります”,
フィールドに英語または数字が格納されている場合は、デフォルトで問題ありません。

対応する SQL ステートメント (例:

CREATE TABLE `test` ( 
`id` INT NOT NULL , 
`name` VARCHAR( 10 ) CHARACTER 
SET utf8 COLLATE utf8_general_ci NOT NULL , 
PRIMARY KEY ( `id` ) 
) 
ENGINE = MYISAM ;

) 2. PHP を使用してデータベースの読み取りと書き込みを行います

データベースに接続した後:

$connection = mysql_connect($host_name, $host_user, $host_pass);

2 行を追加します:

mysql_query("set character set &#39;utf8&#39;");//读库 
mysql_query("set names &#39;utf8&#39;");//写库

MYSQL データベースの読み取りと書き込みは通常どおり行うことができます。 。


4. JS に関連する UTF-8 エンコードの問題

1. JS が Cookie を読み取るときに中国語が文字化けする問題

PHP は、Cookie を書き込むときに中国語の文字をエスケープする必要があります。そうしないと、JS が Cookie 内の中国語の文字を読み取ると意味不明になってしまいます。

但php本身没有escape函数,我们新写一个escape函数:

function escape($str) 
{ 
preg_match_all("/[\x80-\xff].|[\x01-\x7f]+/",$str,$r); 
$ar = $r[0]; 
foreach($ar as $k=>$v) 
{ 
if(ord($v[0]) < 128) 
$ar[$k] = 
rawurlencode($v); 
else 
$ar[$k] = 
"%u".bin2hex(iconv("UTF-8","UCS-2",$v)); 
} 
return join("",$ar); 
}

JS读cookie的时候,用unescape解码,然后就解决cookie中有中文乱码的问题了。

2.外部JS文件UTF-8编码问题

当一个HTML页面或则PHP页面包含一个外部的JS文件时,如果HTML页面或则PHP页面是UTF-8编码格式的文件,外部的JS文件同样要转成UTF-8的文件,否则将出现,没有包含不成功,调用函数时没有反应的情况。

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,如果是ANSI,需要将编码改成:UTF-8。



五.FLASH相关的UTF-8编码问题

FLASH内部对所有字符串,默认都是以UTF-8处理

1.FLASH读文普通本文件(txt,html)

要将文本文件的编码存为UTF-8

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,如果是ANSI,需要将编码改成:UTF-8。

2.FLASH读XML文件

要将XML文件的编码存为UTF-8

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,如果是ANSI,需要将编码改成:UTF-8。

在XML第1行写:

<?xml version="1.0" encoding="utf-8"?>

 

3.FLASH读PHP返回数据

如果PHP编码本身是UTF-8的,直接echo就可以了。

如果PHP编码本身是GB2312的,可以将PHP转存成UTF-8编码格式的文件,直接echo就可以了

如果PHP编码本身是GB2312的,而且不允许改文件的编码格式,用下面的语句将字符串转换成UTF-8的编码格式

$new_str = iconv("GB2312", "UTF-8", "$str");

再echo就可以了

4.FLASH读数据库(MYSQL)的数据

FLASH要通过PHP读取数据库中的数据,PHP本身的编码不重要,关键是如果数据库的编码是GB2312的话,需要用下面的语句将字符串转换成UTF-8的编码格式。

$new_str = iconv("GB2312", "UTF-8", "$str");

5.FLASH通过PHP写数据

一句话,FLASH传过来的字符串是UTF-8格式的,要转换成相应的编码格式,再操作(写文件、写数据库、直接显示等等),还是用iconv函数转换。

6.FLASH使用本地编码(理论上不推荐使用)

如果想让FLASH不使用UTF-8编码,而是使用本地编码。对于中国大陆地区而言,本地编码是GB2312或GBK

AS程序内,可以添加以下代码:

System.useCodepage = true;

那么FLASH内所有字符都是使用GB2312的编码了,所有导入到FLASH或者从FLASH导出的数据,都应该做相应的编码转换。

因为使用本地编码,会造成使用繁体中文地区的用户产生乱码,所以不推荐使用。

 以上就是Web 开发中遇到的UTF-8编码的问题总结的内容,更多相关文章请关注PHP中文网(www.php.cn)! 


声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。