ホームページ >バックエンド開発 >PHPチュートリアル >Unicode 署名付きの PHP (BOM)
UTF-8 エンコーディングで保存された PHP ファイルを書き込んだり変更したりすると、次のような不可解な問題が発生することがあります。
1. ページに「锘」という単語が表示され、残りが空白になります。
2. ログインまたはログアウトできません。 3. ページの上部に空白行が表示されます。
5. 生成された画像がブラウザーで認識されません。
分析の理由:
ファイルが UTF-8 エンコーディングで保存される場合、Unicode 署名 (BOM) がある場合と Unicode 署名がない場合の 2 つの状況が考えられます。 BOM 情報は、ファイルの先頭にある隠し文字の文字列であり、一部の編集者がこれが UTF-8 でエンコードされたファイルであることを認識できるようにするために使用されます。
WINDOWS 独自のメモ帳やその他のソフトウェアと同様に、UTF-8 でエンコードされたファイルを保存すると、ファイルの先頭に 3 つの目に見えない文字 (0xEF 0xBB 0xBF、つまり BOM??バイト オーダー マーク) が挿入されます。これは、メモ帳などの編集者がファイルが UTF-8 でエンコードされているかどうかを識別できるようにするために使用される隠し文字の文字列です。通常のファイルの場合は問題ありません。
しかし、PHP では、設計時に BOM の問題を考慮していませんでした。UTF-8 でエンコードされたファイルの先頭にある BOM の 3 文字は無視されず、BOM がファイルの先頭テキストの一部として使用されます。ファイル。 または
解決策:
テキスト ファイルを編集または変更する場合は、BOM がランダムに追加されないエディタを使用してください。 Linux 上のエディタではこの問題は発生しません。 WINDOWSではメモ帳などのエディタは使用しないでください。推奨されるエディターは、Editplus バージョン 2.12 以降、UltraEdit (「BOM の追加」の関連オプションをキャンセルする必要があります)、「BOM の追加」の関連オプションをキャンセルする必要があります。
BOM が追加されたファイルの場合、キャンセルしたい場合は、上記のエディターを使用して一度保存できます。 (Editplus は、最初に gb として保存し、次に UTF-8 として保存する必要があります。)
4 つのツール、ultraedit、editplus、notepad は、UTF-8 に対する異なるサポートを持っています。 以下は、4 つのツールの UTF-8 サポートの概要です。 UTF-8:
UTF-8 BOM ヘッダー: EF BB BF の 3 文字です。
1. メモ帳
メモ帳でファイルを保存するときに UTF-8 形式を選択すると、BOM ヘッダーがファイルのヘッダーに書き込まれます
2. editplus
ファイルを保存するときに UTF-8 形式を選択し、 BOM ヘッダーはファイル ヘッダーには書き込まれません
3. Ultraedit Ultraedit は UTF-8 を最も完全にサポートしています。 Advanced->configuration では、ファイルを保存するときに BOM ヘッダーを書き込むかどうかを選択できます。
4. vi
Linux では、UTF-8 ファイルの先頭に BOM ヘッダーがある場合を指します。 UTF-8エンコーディングで正常に表示します。それ以外の場合は文字化けして表示されます。
いくつかのエンコーディング変換ツールもあります。たとえば、Java を使用して、BOM ヘッダーを追加しない単純なエンコーディング変換ツールを作成できます。
付録:
UltreEdit の設定で、「保存時にすべての UTF-8 に UTF-8 ファイル ヘッダー マーク (BOM) を書き込む」オプションをオフにします。つまり、保存時に UTF-8 BOM ヘッダーをすべての UTF-8 ファイルに書き込みます。
バージョンによっては搭載されていない可能性があるので、「utf8の自動検出」をオフにする必要があります。このようにutf8ファイルを見ると文字化けしてしまいます。
editplusの使用をお勧めします。
ディレクトリ内のファイルに BOM プログラムがあるかどうかを検出します:
//このファイルは、UTF8 でエンコードされたファイルに BOM があり、自動的に削除できるかどうかを簡単にテストするために使用されます
//Bob Shen による
$basedir =".";; //この動作のために検出する必要があるディレクトリを変更します。
$auto=0; //検出された BOM 情報を自動的に削除するかどうか。 1 ははい、0 はいいえを意味します。
//以下を変更する必要はありません
if ($dh = opendir($basedir)) {
while (($file = readdir($dh)) !== false) {
if ($file!= '.' && $file!='..' && !is_dir($basedir."/".$file)) echo "ファイル名: $file ".checkBOM("$basedir/$file")."
;";
}
Closedir($dh);
}
function checkBOM ($filename) {
グローバル $auto;
$contents=file_get_contents($filename);
$charset[1]=substr($contents, 0, 1);
$charset[2]=substr($contents, 1, 1);
$charset[3]=substr($contents, 2, 1);
if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191) {
if ($auto==1) {
$rest=substr($contents, 3);
rewrite ($filename, $rest);
return ("BOM が見つかりました。自動的に削除されました。");
} else {
return ("BOM が見つかりました。");
}
}
else return (「BOM が見つかりません。」);
}
関数書き換え ($filename, $data) {
$filenum=fopen($filename,"w");
flock($filenum,LOCK_EX);
fwrite($filenum,$data);
fclose($filenum);
}
?>
参考文章:
http://paingaingavin.spaces.live.com/blog/cns!7A6BACD7A08F1B4F!1767.entry
http://www.diggsoft.com/websoft/blog/200810-12-15045.html