ホームページ  >  記事  >  バックエンド開発  >  PHP と Unicode 署名 (BOM)_PHP チュートリアル

PHP と Unicode 署名 (BOM)_PHP チュートリアル

WBOY
WBOYオリジナル
2016-07-21 14:55:54818ブラウズ

UTF-8 エンコードで保存された PHP ファイルを作成または変更すると、次のような不可解な問題が発生することがあります。
1. ページに「锘」という文字が表示され、残りが空白になります
2. ログインまたはログアウトできません。 . ページの上部に空白行が表示されます。
5. 生成された画像がブラウザで認識されません。
理由の分析:
ファイルが UTF-8 エンコーディングで保存される場合、Unicode 署名 (BOM) がある場合と Unicode 署名がない場合の 2 つの状況が考えられます。 BOM 情報は、ファイルの先頭にある隠し文字の文字列で、一部の編集者がこれが UTF-8 でエンコードされたファイルであることを認識できるようにするために使用されます。

WINDOWS に付属のメモ帳などのソフトウェアは、UTF-8 でエンコードされたファイルを保存するときに、ファイルの先頭に 3 つの非表示文字 (0xEF 0xBB 0xBF、BOM - バイト オーダー マーク) を挿入します。これは、メモ帳などの編集者がファイルが UTF-8 でエンコードされているかどうかを識別できるようにするために使用される隠し文字の文字列です。通常のファイルの場合は問題ありません。

しかし、PHP では、設計時に BOM の問題が考慮されておらず、UTF-8 でエンコードされたファイルの先頭にある BOM の 3 文字は無視されず、BOM がファイルの先頭テキストの一部として使用されます。ファイル。
解決策:

テキスト ファイルを編集または変更する場合は、BOM をランダムに追加しないエディタを必ず使用してください。 Linux 上のエディタではこの問題は発生しません。 WINDOWSではメモ帳などのエディタは使用しないでください。推奨されるエディターは、Editplus バージョン 2.12 以降、UltraEdit (「BOM の追加」の関連オプションをキャンセルする必要があります)、「BOM の追加」の関連オプションをキャンセルする必要があります。

BOMが追加されたファイルについて、キャンセルしたい場合は、上記のエディタを使用して一度保存できます。 (Editplus は最初に gb として保存し、次に UTF-8 として保存する必要があります。)

ultraedit、editplus、notepad の 4 つのツールは、UTF-8 に対してそれぞれ異なるサポートを持っています。 以下は、4 つのツールの UTF サポートの概要です。 -8:
UTF-8 BOM ヘッダー: EF BB BF の 3 文字です。
1. メモ帳
メモ帳 保存するときに UTF-8 形式を選択すると、BOM ヘッダーがファイルのヘッダーに書き込まれます
2. editplus
ファイルを保存するときに UTF-8 形式を選択すると、BOM ヘッダーは書き込まれません。ファイルヘッダーに書かれています
3.ultraedit
ultraedit は UTF-8 を最も完全にサポートしています。 Advanced->configuration では、ファイルを保存するときに BOM ヘッダーを書き込むかどうかを選択できます。
Linux では、UTF-8 ファイルの先頭に BOM ヘッダーがある場合、vi を指します。 UTF-8エンコーディングで正常に表示します。それ以外の場合は文字化けして表示されます。
たとえば、Java を使用して簡単なエンコーディング変換ツールを作成することもできます。これらのツールは BOM ヘッダーを追加しません。

付録:

UltreEdit の設定で、「保存時にすべての UTF-8 に対して UTF-8 ファイル ヘッダー マーク (BOM) を書き込む」オプションをオフにします。つまり、保存時に UTF-8 BOM ヘッダーをすべての UTF-8 ファイルに書き込みます。
バージョンによっては搭載されていない可能性があるため、「utf8の自動検出」をオフにする必要があります。このままutf8ファイルを見ると文字化けしてしまいます。
editplusの使用をお勧めします。


ディレクトリ内のファイルに BOM プログラムがあるかどうかを検出します:
//このファイルは、UTF8 でエンコードされたファイルに BOM があり、自動的に削除できるかどうかを簡単にテストするために使用されます
//Bob Shen による

$basedir =".";; //この動作のために検出する必要があるディレクトリを変更します。
$auto=0; //検出された BOM 情報を自動的に削除するかどうか。 1 ははい、0 はいいえを意味します。

//以下を変更する必要はありません

if ($dh = opendir($basedir)) {
while (($file = readdir($dh)) !== false) {
if ($file!= '.' && $file!='..' && !is_dir($basedir."/".$file)) echo "ファイル名: $file ".checkBOM("$basedir/$file")."
;";
}
closedir($dh);
}

function checkBOM ($filename) {
global $auto;
$contents=file_get_contents($filename);
$charset[1]=substr($contents, 0, 1 );
$charset[2]=substr($contents, 1, 1);
$charset[3]=substr($charset[1]); ==239 && ord($charset[2])==187 && ord($charset[3])==191) {
if ($auto==1) {
$rest=substr($contents, 3) ;
rewrite ($filename, $rest);
return ("BOM が見つかりました。");return ("BOM が見つかりました。");
}
}
else return ("BOM が見つかりません。")
}

関数の書き換え ($filename, $data) {
$filenum=fopen($filename,"w");
fwrite($filenum,$data)
?>



http://www.bkjia.com/PHPjc/364307.html

www.bkjia.com

http://www.bkjia.com/PHPjc/364307.html技術記事 UTF-8 エンコードで保存された PHP ファイルを作成または変更すると、時々不可解な問題が発生することがあります。 1. ページに「锘」という単語が表示され、残りが空白になります。 2. ログインできない、またはログインできません...
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。